统计
  • 建站日期:2021-03-10
  • 文章总数:10192 篇
  • 评论总数:216 条
  • 分类总数:56 个
  • 最后更新:4月19日
网站首页 > 文章分类
数据挖掘
五级数据挖掘工程师,你处在哪一级?|大数据博客

有天跟某个行业的朋友聊天,谈起团队建设,我说你们团队有不少年轻人拿了大数据专家(各类证书)的职称,很厉害,他略带讽刺的说:那个没用,只会考试和调参,不会做事。数据挖掘很大工作不就是调参吗?为什么他提到的这些“厉害”的人物...

一个资深数据人对数据挖掘解读|大数据博客

在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过程中,发现数据挖掘本身包含很多层次。并且模型本身也...

如何构建一个反电信网络诈骗基础模型?|大数据博客

作者:西角边的MR网络诈骗,电信诈骗层出不穷,花样翻新,防不胜防,伤害普通百姓利益。本文通过对目前社会上关于网络电信诈骗新闻进行提取,从中分析当前网络诈骗发展趋势和关键因素,进而构建合理的反诈骗模型。一、对关键词的分析爬...

支付风控模型分析|大数据博客

作者:凤凰牌老熊支付风控涉及到多方面的内容,包括反洗钱、反欺诈、客户风险等级分类管理等。其中最核心的功能在于对实时交易进行风险评估,或者说是欺诈检测。如果这个交易的风险太高,则会执行拦截。由于反欺诈检测是在交易时实时进行...

数据挖掘入门指南!!!|大数据博客

数据分析探索性数据分析(ExploratoryDataAnalysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。常用的第三方库数据科学库...

简单的中文分词算法|大数据博客

作者:邓旭东HIT想了解点中文文本处理的底层一些的知识,在网上查了下跟python有关的文本分析书记,意外发现一本新书。书籍简介本书是一本研究汉语自然语言处理方面的基础性、综合性书籍,涉及NLP的语言理论、算法和工程实践...

傅一平:为什么我否决了90%的建模需求?|大数据博客

看到这个题目也许你会吓一跳,但这个数据可并不夸张。下面是我们的一个案例,从中你会体会到建模的复杂性和不确定性,从而知道为什么我要否决大多数的建模需求。一、需求是什么以下是市场部门的一个营销目标用户的建模需求,具体情况如下...

手把手教你做文本挖掘|大数据博客

文|刘顺祥一、文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。二、文本挖掘步骤1...

HI ! 请登录
注册会员,享受下载全站资源特权。