博士圈

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3988|回复: 16

[持续更新]23个数据科学最佳入门项目

[复制链接]

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
发表于 2023-2-13 10:21:43 | 显示全部楼层 |阅读模式

本文介绍23种数据科学项目创意,以获取有关该增长技术的真实经验。

我们都知道,教科书上所学与实际操作还是有出入的,那关于数据科学有什么好的项目可以实操吗?

我们为你推荐这篇文章,在本教程中,涵盖面向初学者,中级专家和专家的23种机器学习项目创意,以获取有关该增长技术的真实经验。这些机器学习项目构想将帮助你了解在职业生涯中取得成功、和当下就业所需的所有实践。

通过项目学习是你短期内能做的最好投资,这些项目构想使你能够快速发展和增强机器学习技能。语言上,这些机器学习项目可以用Python,R或任何其他工具开发。

面向初学者的机器学习项目

在本部分中,我们列出了针对初学者/初学者的顶级机器学习项目,如果你已经从事基础机器学习项目,请跳至下一部分:中级机器学习项目

1.鸢尾花分类项目

项目构想:鸢尾花有不同的种类,你可以根据花瓣和萼片的长度来区分它们。这是机器学习初学者预测新鸢尾花种类的基础项目。

数据集:鸢尾花分类数据集

https://archive.ics.uci.edu/ml/datasets/Iris


回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-14 09:09:15 | 显示全部楼层

2. Emojify –使用Python创建自己的表情符号

项目构想:该机器学习项目的目标是对人的面部表情进行分类并将其映射为表情符号。我们将建立一个卷积神经网络来识别面部表情。然后,我们将使用相应的表情符号或头像来映射这些情感。

源代码:Emojify项目

https://data-flair.training/blogs/create-emoji-with-deep-learning/  


回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-15 13:53:16 | 显示全部楼层

3.使用机器学习进行贷款预测

项目构想:该ML项目背后的构想是建立一个模型,该模型将对用户可以贷款多少进行分类。它基于用户的婚姻状况,教育程度,受抚养人数和就业情况。我们可以为此项目建立一个线性模型。

数据集:贷款预测数据集

https://www.kaggle.com/altruistdelhite04/loan-prediction-problem-dataset

4.住房价格预测项目

项目构想:数据集包含波士顿剩余区域的房价。房子的费用根据犯罪率,房间数量等各种因素而变化。对于初学者来说,这是一个很好的ML项目,它可以根据新数据预测价格。

数据集:房屋价格预测数据集

https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html


回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-16 11:14:49 | 显示全部楼层
5. MNIST数字分类机器学习项目

项目构想:MNIST数字分类python项目使机器能够识别手写数字。该项目对于计算机视觉可能非常有用。在这里,我们将使用MNIST数据集使用卷积神经网络训练模型。

数据集:MNIST数字识别数据集

https://drive.google.com/file/d/ ... U_1f6c0zLr8V_K/view

源代码:手写数字识别项目

https://data-flair.training/blog ... -digit-recognition/
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-17 11:06:30 | 显示全部楼层
6.使用机器学习预测股价

项目构想:有许多可用于股票市场价格的数据集。这个机器学习初学者的项目旨在根据上一年的数据预测股票市场的未来价格。

数据集:股票价格预测数据集

https://www.kaggle.com/c/two-sigma-financial-news/data

源代码:股票价格预测项目

https://data-flair.training/blog ... -project-in-python/
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-20 11:23:51 | 显示全部楼层
7.泰坦尼克号生存计划

项目构想:这将是一个有趣的项目,因为我们将预测某人是否会在泰坦尼克号飞船中幸存下来。对于这个初学者的项目,我们将使用泰坦尼克号数据集,其中包含幸存者和在泰坦尼克号飞船中死亡的人的真实数据。

数据集:《泰坦尼克号生存》数据集

https://www.kaggle.com/c/titanic
回复

使用道具 举报

1

主题

4

帖子

452

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
452
发表于 2023-2-21 09:55:53 | 显示全部楼层

8.葡萄酒质量检测项目

项目构想:在该项目中,我们可以构建一个界面来预测红酒的质量。它将使用葡萄酒的化学信息,并基于机器学习模型,它将为我们提供葡萄酒质量的结果。

数据集:葡萄酒质量数据集

https://archive.ics.uci.edu/ml/datasets/wine+quality

回复

使用道具 举报

41

主题

46

帖子

285

积分

中级会员

Rank: 3Rank: 3

积分
285
发表于 2023-2-22 10:31:47 | 显示全部楼层
9.假新闻检测项目

项目构想:虚假新闻像野火一样传播,这在这个时代是一个大问题。我们可以学习如何将假新闻与真实新闻区分开。我们可以使用监督学习来实现这样的模型。

数据集:检测虚假新闻数据集

https://drive.google.com/file/d/ ... uN0XUsoIC4a-_q/view

源代码:假新闻检测项目

https://data-flair.training/blog ... etecting-fake-news/
回复

使用道具 举报

9

主题

11

帖子

74

积分

注册会员

Rank: 2

积分
74
发表于 2023-2-23 14:00:53 | 显示全部楼层

中级机器学习项目

1.音乐流派分类机器学习项目

项目构想:该python机器学习项目的思想是开发一个机器学习项目,并自动对音频中的不同音乐流派进行分类。我们需要使用它们的频域和时域低级特征对这些音频文件进行分类。

源代码:音乐流派分类项目

https://data-flair.training/blogs/python-project-music-genre-classification/


回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-24 10:11:50 | 显示全部楼层
2.比特币价格预测器项目

项目构想:比特币价格预测器是一个有用的项目。区块链技术正在发展,并且有许多数字货币在上升。该项目将帮助你使用以前的数据预测比特币的价格。

数据集:比特币价格预测数据集

https://www.kaggle.com/team-ai/bitcoin-price-prediction/version/1
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|博士圈

GMT+8, 2024-12-16 21:55 , Processed in 0.020595 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表