# MyTools **Repository Path**: XiaoLvGe/MyTools ## Basic Information - **Project Name**: MyTools - **Description**: 个人编写的数据分析相关小工具 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2018-11-10 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 个人编写的小工具 --- ### my_ort_adjust_param 采用正交实验的方式进行调参 当超参组合过多时,可以根据正交实验结果确定超参数影响顺序,优先调整对结果影响较大的超参数。 #### my_ort.py 正交表构造参考:https://github.com/lovesoo/OrthogonalArrayTest 添加功能(函数seeSets):输入变量数,返回可选的正交表结构 #### test.py 正交调参测试样例 --- #### my_data_describe.py dataframe各列数据的描述(类型、统计量、缺失率、水平数) --- #### my_calc_IV.py 参考了互联网上的开源实现,使用字符串拼接技巧,减少了循环的使用,效率有所提升 参考链接:http://blog.51cto.com/6093943/2120626 --- #### my_boxplot.py my_boxplot 绘制series列不同分类的箱型图。 my_boxplot_na 空值单独作为一列 my_boxplot_imbalance 数值分布不平衡时,少数类型的值汇总为一类 --- #### my_df_compare.py 比较两个dataframe中对应值是否完全一致 --- #### my_drop_high_corr.py 删除皮尔逊相关系数过大的冗余特征 --- #### my_fillna_model.py 使用简单模型对缺失值进行预测并填充 --- #### my_dummies.py 某列多字段组合,如'class1|class2|class3', 指定分隔符,进行dummies --- #### my_primary_check.py dataframe中主键/组合主键的唯一性检验,返回主键重复的行 --- #### my_pca_coefficient.py pca模型系数的格式化输出 --- #### my_memory_g.py 程序内存占用的格式化输出