什么是深度学习呢?深度学习是一种以深层计算堆栈为特征的机器学习方法。正是这种计算的深度使得深度学习模型能够分解在最具挑战性的真实世界数据集中发现的复杂和层次化的模式。 凭借其强大和可扩展性,神经网络已成为深度学习的标志性模型。神经网络由神经元组成,每个神经元仅执行简单的计算。神经网络的力量来自于这些神经元能够形成的连接的复杂性。 线性单元 那么让我们从神经网络的根本组件开始:单个神经元。作为一个图示,一个具有一个输入的神经元(或单元)看起来像: 线性单元: 输入是 x 。它与神经元的连接有一个权…

2026年1月29日 0条评论 84点热度 0人点赞 MuWinds 阅读全文

缺失值处理 1) 一个简单的选项:删除包含缺失值的列 最简单的选择是删除包含缺失值的列。 除非被删除列中的大多数值缺失,否则这种方法会使模型丢失大量(潜在有用!)的信息。举一个极端的例子,考虑一个包含10,000行的数据集,其中一列缺少一个条目。这种方法会完全删除该列! 2) 更好的选择:插补 Imputation 会用一些数字填补缺失值。例如,我们可以沿每一列填充均值。 在大多数情况下,插补的值不会完全正确,但它通常能比完全删除该列得到更准确的模型。 3) 对插补的扩展 插补是标准方法,通常效果良好。然而,插补的…

2026年1月29日 0条评论 69点热度 0人点赞 MuWinds 阅读全文

记录写kaggle练习时记录的东西 最基础的决策树模型 下面是假设: 你的表弟靠房地产投机赚了数百万美元。他因为你对数据科学感兴趣,所以提出和你合伙做生意。他出资,你则提供预测不同房屋价值的模型。 你问表弟过去是如何预测房产价值的,他说只是凭直觉。但进一步询问后发现,他其实是从过去看过的房子中总结出了价格规律,并利用这些规律来预测他正在考虑的新房的价格。 机器学习的工作原理也类似。我们将从一种叫做决策树的模型开始。虽然还有更高级的模型可以给出更准确的预测,但决策树易于理解,并且是数据科学领域一些最佳模型的基础构建模…

2026年1月22日 0条评论 105点热度 0人点赞 MuWinds 阅读全文

第一次遇到技术面,由于我问题没答上来几道并且时间排不开,所以无疾而终…… 这个岗位的背景:会用Linux进行定位和调试,需要用Python+Django技术栈编写一些简单的运维工具。 第一部分:根据简历进行自我介绍 第二部分:技术面试: 1. Python 中什么场景用Django合适?什么时候用FastAPI合适? Django 适合的场景:​全功能型 Web 应用​需要内置完整功能(如 Admin 后台、ORM、用户认证、模板引擎)。适合内容管理系统(CMS)、电商平台、社交网站等业务逻辑复杂、需要快速原型开发…

2026年1月6日 0条评论 109点热度 0人点赞 MuWinds 阅读全文