测试训练-PRO科技-PROSAGA

代码空间

摘要(Abstract)

在有监督(supervise)的机器学习中，数据集常被分成2~3个即：训练集(train set) 验证集(validation set) 测试集(test set) train 训练数据。拟合模型，用这部分数据来建立模型。是一些我们已经知道输入和输出的数据集训练机器去学习，通过拟合去寻找模型的初始参数。例如在神经网络（Neural Networks)中，我们用训练数据集和反向传播算法（Backpropagation）去每个神经元找到最优的比重（Weights)。 validation 验证数据。train建了一个模型，但是模型的效果仅体现了训练数据，但不一定适合同类的其他数据，所以建模前数据分成两部分，一部分为训练数据，一部分为验证数据（两部分数据的比例大致为7:3，这取决于你验证的方法）。另外，你也可能训练多个模型，但不知哪个模型性能更佳，这时可以将验证数据输入不同模型进行比较。是一些我们已经知道输入和输出的数据集，通过让机器学习去优化调整模型的参数，在神经网络中，我们用验证数据集去寻找最优的网络深度（number of hidden layers)，或者决定反向传播算法的停止点；在普通的机器学习中常用的交叉验证（Cross Validation) 就是把训练数据集本身再细分成不同的验证数据集去训练模型。 test 测试数据。跟前两者的最大区别在于：train和validation数据均是同一对象的数据，但是测试，我们就需要用跨对象的数据来验证模型的稳定性。

主题(Topic)

cross-validation 测试训练 Test training

cross-validation-score pkuseg Operations research 模式识别 Policy engine 决策支持 Process ADAS decision support 场景模型 Feature engineering Deep learning STS elasticsearch 机器学习 Model visualization 视图可视化倒排索引 3DR-Tree ONOS 复合模型 caffe 深度学习数据标准化 Pattern recognition pychart IOTA text recognition fdnlp Resources 搜索引擎 Data standardization Inverted index view visualization 图像识别 image recognition Compound model 策略模型托管 Stanford Nlp 时空索引 TimeGIS Image index 流程引擎物联网应用埃欧塔资源引擎策略控制器图像索引 gis 模型可视化文本识别新型大数据架构 data reduction ggplot2 plot solr pytorch 数据过滤资源 ArcGIS AWS Lambda data filtering 数据降维 ggplot segmaker Model hosting Kappa 流程 Space-time index Process engine STR-tree Graphics 策略执行器 PC PE lattice 运筹学 Machine learning Strategy Scene Model chart opencv RAM

vowpalwabbit biological-neural-network nearest-neighbor cross-validation hw tm data-science classification mlr normalization data-analysis perceptron oversampling artificial-intelligence rapidminer multinomial training-module document-classification backpropagation autoregressive-models svm r-caret logistic-regression resampling arff polynomials matlab-cvst fann predict training-data keras-layer recommendation-engine dataset one-hot-encoding online-judge multivariate-testing exercises test-data libsvm mahout-recommender Test+training

cross-validation-time-series kfold-cross-validation leave-pair-out-cross-validation cross-field-validation cross-validation-selection fold-cross-validation nested-cross-validation stratified-cross-validation timeseries-cross-validation vfold-cross-validation 10-fold-cross-validation grid-search-cross-validation group-kfold-cross-validation k-fold-cross-validation randomized-search-cross-validation leave-one-out-cross-validation pytorch-k-fold-cross-validation credit-score credit-scorecard validation validation- auc-score beauty-score bleu-score block-score box-score confidence-score connectivity-score correlation-score cric-score cricket-score difference-score fisher-score fuzzy-score github-score grid-score health-score icon-score imdb-score inception-score influence-score ippt-score kaggle-score leaderboard-score lighthouse-score likelihood-score live-score match-score

项目(Project)

ddellagiacoma/machinelearning-2017-assignment-1 JacopoOrlandini/Progetto-AI-Orlandini iam-damar/Machine-Learning-Cross-VSplit ahaeusser/tscv dhamvi01/Cross-Validation dchandak99/Cross-Validation mljs/cross-validation SagarSharma4244/Cross-Validation anuragkumar/Cross-Validation Suhail-Shaikh-96/Decision-Tree-and-Cross-Validation-implementation-on-Wine-Dataset-to-predict-quality-of-wine wmkouw/ctrl-iwxval benkeser/cvma SamComber/spacv anirbmuk/MaterialFormDemo tlverse/origami muhk01/KFold_Cross-Validation-of-Iris-Dataset-using-KNN TarunSunkaraneni/PolyRegCrossValidation retowyss/cross-val-sim daanknoope/kv_block_cross_validation canorusmusic/canorus AnnaShestova/xgboost-cross-validation PoetVogon/Timeseries-Cross-Validation ammardodin/assistant-cross-validation ilhamksyuriadi/kNN-with-k-Fold-Cross-Validation TarunSunkaraneni/LinearRegPlot nickkunz/nestedhyperline nickkunz/nestedhyperboost atecon/CvDataSplitter skagnihotri/Breast-Cancer-Classification LREN-CHUV/woken-validation 全部项目