博士圈

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
12
返回列表 发新帖
楼主: DataIst

[持续更新]23个数据科学最佳入门项目

[复制链接]

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-2-27 09:55:05 | 显示全部楼层

3. Uber数据分析项目

项目构想:该项目可用于对超级数据执行数据可视化。该数据集包含纽约市中的450万个超级拾取器。为了分析行程,需要精美地表示很多数据,以便可以进一步改善业务。

数据集:Uber数据分析数据集

https://drive.google.com/file/d/1emopjfEkTt59jJoBH9L9bSdmlDC4AR87/view

源代码:Uber数据分析项目

https://data-flair.training/blogs/r-data-science-project-uber-data-analysis/


回复

使用道具 举报

41

主题

46

帖子

304

积分

中级会员

Rank: 3Rank: 3

积分
304
发表于 2023-3-6 13:42:44 | 显示全部楼层
4.人格预测项目

项目构想:Myers Briggs类型指示器是一种个性类型系统,根据内向,直觉,思维和感知能力将一个人分为16个不同的个性。我们可以根据他们在社交媒体上发布的帖子的类型来确定其个性。

数据集:个性预测数据集

https://www.kaggle.com/datasnaek/mbti-type
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-3-7 10:35:16 | 显示全部楼层
5. Xbox游戏预测项目

项目构想:人们在搜索时生成的数据可用于预测用户的兴趣。BestBuy消费电子公司已提供了来自用户的数百万次搜索的数据,我们将预测用户最有兴趣购买的Xbox游戏。这将用于向游客推荐游戏。

数据集:Xbox游戏预测数据集

https://www.kaggle.com/c/acm-sf-chapter-hackathon-small/overview
回复

使用道具 举报

41

主题

46

帖子

304

积分

中级会员

Rank: 3Rank: 3

积分
304
发表于 2023-3-8 14:21:17 | 显示全部楼层
6.信用卡欺诈检测项目
项目构想:使用卡进行大量交易的公司需要发现系统中的异常情况。该项目旨在建立信用卡欺诈检测模型。我们将使用交易及其标签作为欺诈或非欺诈来检测客户进行的新交易是否为欺诈。

数据集:信用卡欺诈检测数据集

https://drive.google.com/file/d/ ... VYglctpr5sjTy4/view

源代码:信用卡欺诈检测项目

https://data-flair.training/blog ... rd-fraud-detection/
————————————————
版权声明:本文为CSDN博主「Techblog of HaoWANG」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/hhaowang/article/details/112175867
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-3-9 09:24:35 | 显示全部楼层
使用机器学习进行客户细分


项目构想:客户细分是一种根据客户的购买历史,性别,年龄,兴趣等对客户进行细分的技术。获取此信息非常有用,以便商店可以在个性化营销方面获得帮助,并为客户提供相关的信息交易。在该项目的帮助下,公司可以运行特定于用户的活动并提供特定于用户的报价,而不是向所有用户广播相同的报价。

数据集:客户细分数据集

https://drive.google.com/file/d/ ... VYglctpr5sjTy4/view

源代码:客户细分项目

https://data-flair.training/blog ... tomer-segmentation/
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-3-13 11:38:21 | 显示全部楼层
使用机器学习进行情感分析

项目构想:情感分析是分析用户情感的过程。我们可以将他们的情绪分为正面,负面或中性。了解如何进行情感分析是一个很棒的项目,并且如今已被广泛使用。这是最受欢迎的机器学习项目之一。其背后的原因是每家公司都试图了解客户的情绪,如果客户满意,他们会留下来。该项目可能显示出减少客户流失的途径。

数据集:情感分析数据集

http://ai.stanford.edu/~amaas/data/sentiment/

源代码:情感分析项目

https://data-flair.training/blog ... t-analysis-project/
回复

使用道具 举报

26

主题

41

帖子

217

积分

中级会员

Rank: 3Rank: 3

积分
217
 楼主| 发表于 2023-3-14 08:56:19 | 显示全部楼层
2.安然调查项目


项目构想:安然公司(Enron)在2000年倒闭,但可提供数据进行调查。该数据库包含500,000名在公司工作的真实员工的电子邮件,因此数据对于执行数据分析非常有用,许多数据科学家都使用此数据集。

数据集:安然调查数据集

https://www.cs.cmu.edu/~enron/
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|博士圈

GMT+8, 2025-4-3 10:05 , Processed in 0.017267 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表