手机浏览器扫描二维码访问
巧妇难为无米之炊,数据就是机器学习的“米”。
- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。
- 数据预处理:这步特别关键,就像淘米要去沙。包括:
- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。
- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。
- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。
2. 特征工程:给数据“化妆”,让模型看得更清楚
“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。
- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。
- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。
3. 模型训练:让机器“刷题涨本事”
选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。
- 训练过程中,得注意过拟合和欠拟合:
- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。
- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。
解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。
4. 模型评估:给机器“考试”打分
训练好的模型得测试一下准不准。常用的指标有:
- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。
薄情寡义x心怀鬼胎 应再芒从没想过富家公子流落在外多年后被找回的故事会发生在他身上 直到商恪将他带回去,成为了他的哥哥...
冷漠的看客情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,冷漠的看客-微笑先生-小说旗免费提供冷漠的看客最新清爽干净的文字章节在线阅读和TXT下载。...
财阀温家的独女温果儿在25岁的庆生宴上,意外身亡,一睁眼回到70年代,成了唐家的小童养媳。怎料,刚重生就被婆婆安排洞房,却被军官兵王言辞拒娶……温果儿:哼,本公主才艺双全,医术制药双科天才,还搞不定你?!世事无常,军官哥哥来寻亲,身份逆袭!身居高位的爷爷更是偏爱无边。得古书,寻宝藏,收四合院,多种配方在手,技能群起......
周喻得到人生体验系统,穿梭不同影视世界体验全新人生,生活并非永远波涛骇浪,也有平凡中见真章,主要为都市影视剧无超凡。《三十而已》许幻山----体验中......
文案:宋厌转学第一天就撞见自己的新室友被一群混混堵在巷子里要债。新室友手起棍落,小混混落荒而逃,边跑还边不忘骂骂咧咧:“你说你长了这么一张小白脸,去找个富婆早就发家致富了,还怕还不上这点钱吗!”新室友面露赞同并恍然大悟:“有道理啊。”宋厌:“……”有个屁道理。于是为了阻止新室友就此走上歧途,宋厌开始了定点扶贫清纯美貌男高中生的不归路。没钱吃晚饭,他买,没钱交书本费,他交,没钱买围巾,他趁着买一送一再捎上一条。本来就被家里限制了经济支出的宋大少爷不得不学会勤俭节约吃苦耐劳。然后他爸就带他参加了一个晚宴:“来,小厌,给你介绍一下,这是你夏爷爷的孙子,夏枝野。”宋厌看着面前一身定制西服,脖子上却围着他从学校门口买一送一淘来的破围巾的夏枝野,面无表情地举起了刀。·当晚,某高中男生宿舍传来家暴声:“滚你妈的,别和我装穷!”被家暴对象却只是耐心哄道:“没和你装穷,是真穷。但我以后会很有钱,还会把钱都交给男朋友管,所以你要不要考虑一下?”臭不要脸脾气很好骚话攻x嘴硬心软脾气很差酷哥受内容标签:强强甜文爽文校园搜索关键字:主角:宋厌,夏枝野┃配角:接档文《别管我闲事》专栏求预收┃其它:微博:林七年年年:...
文臣为后作者:清风入淮文案:残疾太子腹黑骚攻vs文臣貌美诱受攻又色批又疯批,受又忠诚又貌美,简称疯狗追美人。壬申年,房青玄被陷害入狱,蒙冤受辱,在狱中无人问津,太子差人给他送了一碗热乎的饭,他便暗自发誓要追随太子,结果没想到太子竟然是个好男风的大纨绔。太子:“房大人,知道此物名叫什么吗?”房青玄一脸天真:“不知。”太子:“此物能让...