网络招商平台网站怎么做福建福清市住房和建设局网站

张小明 2026/3/12 11:37:21
网络招商平台网站怎么做,福建福清市住房和建设局网站,idc 网站备案,访问wordpress数据库Scikit-Learn#xff08;简称sklearn#xff09;是Python生态中最主流的机器学习库#xff0c;基于NumPy、SciPy和Matplotlib构建#xff0c;封装了分类、回归、聚类、降维、模型评估等全套机器学习功能#xff0c;兼具易用性和灵活性。本文从实战角度出发#xff0c;覆盖…Scikit-Learn简称sklearn是Python生态中最主流的机器学习库基于NumPy、SciPy和Matplotlib构建封装了分类、回归、聚类、降维、模型评估等全套机器学习功能兼具易用性和灵活性。本文从实战角度出发覆盖Sklearn核心使用流程、常用算法实现、参数调优及实战案例帮助初学者快速上手同时为进阶开发者提供落地思路。一、Scikit-Learn入门准备环境搭建与核心思想1. 环境安装确保已安装Python3.7及以上版本通过pip完成Sklearn及依赖库安装# 基础安装含NumPy、SciPypipinstallscikit-learn# 完整版含可视化、数据处理pipinstallscikit-learn numpy pandas matplotlib seaborn验证安装是否成功importsklearnprint(sklearn.__version__)# 输出版本号如1.3.0则安装成功2. Sklearn核心设计思想Sklearn遵循“统一接口、模块化设计”原则所有机器学习模型分类器、回归器、聚类器等均实现了一致的API核心流程可总结为数据准备 → 数据预处理 → 模型实例化 → 模型训练 → 模型预测 → 模型评估 → 模型调优核心特点所有模型均通过fit()方法训练predict()方法预测预处理、特征工程、模型评估等功能模块化可灵活组合内置经典数据集如鸢尾花、波士顿房价便于入门练习。二、核心流程实战以分类任务为例1. 数据准备加载数据集Sklearn内置多个经典数据集也支持导入外部数据如CSV此处以鸢尾花分类数据集经典多分类任务为例# 导入内置数据集fromsklearn.datasetsimportload_iris# 导入数据处理工具importpandasaspd# 加载数据集irisload_iris()# 转换为DataFrame便于查看dfpd.DataFrame(iris.data,columnsiris.feature_names)df[target]iris.target# 标签列0/1/2对应三种鸢尾花# 查看数据基本信息print(df.head())# 前5行数据print(df.shape)# 数据维度150行×5列print(iris.target_names)# 标签对应名称[setosa versicolor virginica]外部数据导入示例CSV文件# 导入本地CSV数据dfpd.read_csv(your_data.csv)# 分离特征和标签Xdf.drop(target,axis1)# 特征矩阵ydf[target]# 标签向量2. 数据预处理划分训练集/测试集特征标准化机器学习中需将数据划分为训练集用于模型训练和测试集用于评估模型泛化能力同时特征标准化可提升多数模型如SVM、逻辑回归的性能。# 导入预处理工具fromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardScaler# 分离特征X和标签yXiris.data yiris.target# 划分训练集80%和测试集20%X_train,X_test,y_train,y_testtrain_test_split(X,y,test_size0.2,random_state42# random_state固定随机种子保证结果可复现)# 特征标准化均值为0方差为1scalerStandardScaler()# 仅在训练集上拟合scaler避免数据泄露X_train_scaledscaler.fit_transform(X_train)# 测试集使用训练集的scaler转换X_test_scaledscaler.transform(X_test)关键说明测试集不能参与scaler的拟合否则会引入测试集信息导致模型评估偏乐观常用预处理工具StandardScaler标准化、MinMaxScaler归一化、OneHotEncoder类别特征编码、SimpleImputer缺失值填充。3. 模型实例化与训练以逻辑回归为例选择逻辑回归LogisticRegression作为分类模型遵循Sklearn统一API# 导入逻辑回归模型fromsklearn.linear_modelimportLogisticRegression# 实例化模型可指定参数如正则化强度CmodelLogisticRegression(C1.0,random_state42)# 训练模型仅用训练集model.fit(X_train_scaled,y_train)常用模型快速替换只需替换导入的模型类API完全一致例如# 决策树分类器fromsklearn.treeimportDecisionTreeClassifier modelDecisionTreeClassifier(max_depth3,random_state42)# 随机森林分类器fromsklearn.ensembleimportRandomForestClassifier modelRandomForestClassifier(n_estimators100,random_state42)# 支持向量机SVMfromsklearn.svmimportSVC modelSVC(kernelrbf,C1.0,random_state42)4. 模型预测与评估训练完成后用测试集预测并评估模型性能分类任务常用评估指标准确率accuracy、精确率precision、召回率recall、F1值、混淆矩阵。# 模型预测y_predmodel.predict(X_test_scaled)# 预测标签y_pred_probamodel.predict_proba(X_test_scaled)# 预测概率多分类任务# 模型评估fromsklearn.metricsimportaccuracy_score,classification_report,confusion_matrix# 准确率整体预测正确的比例accuracyaccuracy_score(y_test,y_pred)print(f模型准确率{accuracy:.2f})# 详细分类报告精确率、召回率、F1值print(分类报告)print(classification_report(y_test,y_pred,target_namesiris.target_names))# 混淆矩阵直观展示各类别预测情况cmconfusion_matrix(y_test,y_pred)print(混淆矩阵)print(cm)输出示例逻辑回归模型准确率1.00 分类报告 precision recall f1-score support setosa 1.00 1.00 1.00 10 versicolor 1.00 1.00 1.00 7 virginica 1.00 1.00 1.00 13 accuracy 1.00 30 macro avg 1.00 1.00 1.00 30 weighted avg 1.00 1.00 1.00 30 混淆矩阵 [[10 0 0] [ 0 7 0] [ 0 0 13]]5. 模型调优网格搜索GridSearchCV默认参数往往不是最优的通过网格搜索遍历指定参数组合找到最优参数# 导入网格搜索工具fromsklearn.model_selectionimportGridSearchCV# 定义参数网格param_grid{C:[0.1,1,10,100],# 正则化强度penalty:[l1,l2],# 正则化类型l1/l2solver:[liblinear]# 求解器l1正则化需用liblinear}# 实例化网格搜索交叉验证折数cv5grid_searchGridSearchCV(estimatorLogisticRegression(random_state42),param_gridparam_grid,cv5,# 5折交叉验证scoringaccuracy# 评估指标)# 训练网格搜索grid_search.fit(X_train_scaled,y_train)# 输出最优参数和最优分数print(f最优参数{grid_search.best_params_})print(f交叉验证最优准确率{grid_search.best_score_:.2f})# 使用最优模型预测best_modelgrid_search.best_estimator_ y_pred_bestbest_model.predict(X_test_scaled)print(f最优模型测试集准确率{accuracy_score(y_test,y_pred_best):.2f})三、回归任务实战以波士顿房价预测为例回归任务与分类任务流程一致核心差异在于标签为连续值评估指标不同均方误差MSE、决定系数R²等。# 导入回归数据集和模型fromsklearn.datasetsimportload_diabetes# 糖尿病数据集回归fromsklearn.linear_modelimportLinearRegressionfromsklearn.metricsimportmean_squared_error,r2_score# 加载数据diabetesload_diabetes()Xdiabetes.data ydiabetes.target# 划分训练集/测试集X_train,X_test,y_train,y_testtrain_test_split(X,y,test_size0.2,random_state42)# 标准化特征scalerStandardScaler()X_train_scaledscaler.fit_transform(X_train)X_test_scaledscaler.transform(X_test)# 实例化并训练线性回归模型lr_modelLinearRegression()lr_model.fit(X_train_scaled,y_train)# 预测y_predlr_model.predict(X_test_scaled)# 回归评估指标msemean_squared_error(y_test,y_pred)# 均方误差r2r2_score(y_test,y_pred)# 决定系数越接近1越好print(f均方误差MSE{mse:.2f})print(f决定系数R²{r2:.2f})四、Sklearn核心功能模块速查模块名功能常用类/函数sklearn.datasets数据集加载load_iris、load_diabetes、fetch_california_housingsklearn.model_selection数据划分与调优train_test_split、GridSearchCV、cross_val_scoresklearn.preprocessing数据预处理StandardScaler、MinMaxScaler、OneHotEncoder、SimpleImputersklearn.linear_model线性模型LogisticRegression、LinearRegression、Ridge、Lassosklearn.tree树模型DecisionTreeClassifier、DecisionTreeRegressorsklearn.ensemble集成学习RandomForestClassifier、GradientBoostingRegressorsklearn.svm支持向量机SVC、SVRsklearn.cluster聚类算法KMeans、DBSCANsklearn.decomposition降维PCA、TSNEsklearn.metrics模型评估accuracy_score、classification_report、mean_squared_error、r2_score五、实战避坑指南数据泄露测试集不能参与任何预处理如scaler.fit需仅用训练集拟合预处理工具测试集仅做transform随机种子设置random_state固定随机数种子保证实验结果可复现类别不平衡分类任务若类别数量差异大需用class_weight参数调整权重或使用SMOTE过采样过拟合树模型/集成模型可通过限制max_depth、n_estimators或增加正则化避免过拟合特征缩放线性模型、SVM、KNN等对特征尺度敏感必须做标准化/归一化树模型对尺度不敏感可省略。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

响应式网站建设的应用场景去国外做外卖网站好

今天给大家带来一款电子发票识别软件,非常好用,有需要的小伙伴可以下载收藏。 第一款:电子发票识别工具 批量精准识别 这款软件无需安装,下载之后打开图标就能直接使用了。 可以提前把发票文件放在一个文件夹内。 然后&#xff0…

张小明 2026/3/5 4:07:49 网站建设

国外效果超炫网站动画设计模板

Obsidian表格插件革命:告别繁琐,拥抱高效数据管理新体验 【免费下载链接】obsidian-excel 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-excel 还在为Obsidian中处理表格数据而烦恼吗?传统的Markdown表格编辑体验简直让人崩…

张小明 2026/3/5 4:07:50 网站建设

浏览器网站有哪些建设工程信息比较好的网站

前言 在 AI 应用快速发展的今天,知识库已成为企业和个人提升效率的关键工具。 • 大模型的优势:腾讯混元大模型具备强大的自然语言理解与生成能力,支持文本、图像等多模态输入,能够快速构建智能问答与知识检索系统。• Cherry Stu…

张小明 2026/3/5 4:07:50 网站建设

网站做一样的算侵权么网页免费游戏

第一章:揭秘Dify解析加密PDF失败的根本原因在处理文档自动化流程时,Dify作为一款强大的AI应用开发平台,常被用于解析和提取PDF文件中的结构化信息。然而,当面对加密PDF时,系统往往无法正常读取内容,导致解析…

张小明 2026/3/4 5:42:11 网站建设

做购物网站 国外服务器中国纪检监察报电子版2021

第一章:Open-AutoGLM文创生成的核心价值Open-AutoGLM 是面向文化创意产业的开源生成式语言模型,其核心价值在于将人工智能深度融入内容创作流程,实现高效、多样且富有文化内涵的文本生成。该模型不仅支持多语言、多风格输出,还能结…

张小明 2026/3/5 4:07:51 网站建设

福永网站开发WordPress多站点同步设置

目录已开发项目效果实现截图已开发项目效果实现截图开发技术系统开发工具:已开发项目效果实现截图开发技术系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结…

张小明 2026/3/5 4:07:55 网站建设