什么叫绪论? [手动旺柴🐕]
书籍或论文开头说明主旨和内容的部分。
开篇2个W和一个H。
1.什么是数挖?
数据挖掘,是一种将传统数据分析方法与处理大量数据的复杂算法相结合的技术。
2.为什么需要数挖?
数据收集和数据存储技术的快速发展,让各种组织结构累积了Mass Data。如何从这些海量Data中Extract Valuable Info 以assist Decision-making,成为Great-Challenge。 于是数挖(Data Mining)就站出来了,saying “I can do that”
3.如何数挖?
这个问题问得好
提问:怎么知道:货架的组织会影响商品的销售!?
事先是不知道这个知识的,但从消费者的购物清单信息中,
挖掘出了这个知识。即: 关联销售!
美国的妇女通常在家照顾孩子,
所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,
而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。
这种现象就是卖场中商品之间的关联性,研究“啤酒与尿布”关联的方法就是购物篮分析
一下出现了好多陌生名词,我大概百度了一下:
- 购物篮分析:
购物篮指的是超级市场内供顾客购物时使用的装商品的篮子,
当顾客付款时这些购物篮内的商品被营业人员通过收款机一一登记结算并记录。
所谓的购物篮分析(Market Basket Analysis)
就是通过这些购物篮子所显示的信息来研究顾客的购买行为。
主要的目的在于找出什么样的东西应该放在一起。
藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品,
找出相关的联想(association)规则,企业藉由这些规则的挖掘获得利益与建立竞争优势。- 关联销售
关联销售类似于捆绑销售,即将产品“打包”销售,
比如将速溶咖啡和杯子打包销售,其目的是在满足顾客需求的同时
(包括产品价格和产品种类均满足顾客需求,关联销售的价格相对于单独购买,一般都比较优惠),
从而提高销售收入,达到双赢。
首先,是为了最终实现网络广告投放策略的真正价值。
然后,通过挖掘网络中潜在的社区人群,
企业可以更好地搜索潜在消费者和传播对象,
将分散的目标顾客和受众精准地聚集在一起,
精确地把广告投放给目标客户,
于是乎,这不但有效降低单人营销费用,而且可以减少对非目标客户的干扰,
提高广告的满意度,
可是好多广告都令人不快,直接一气之下用脚本或者vip
例如:
▶ 通过跨语言信息检索可方便地检索不同语种的网络资源
▶ 通过文本聚类算法对搜索返回结果进行划分处理,用户可以根据聚类结果快速定位到所需资源;
▶ 通过显式或隐式地收集用户偏好信息,深层次地挖掘用户个人兴趣,为用户提供个性化的搜索服务;
▶ 通过交互的查询扩展功能改善用户查询词,同时可让系统更好地理解用户的检索意图。
上述例子来自于不同Application Area,
但是 data mining is the core processing technology behind it
可以从 技术
和 商业
两个层面定义:
数据挖掘所得的信息有三个特征:
先前未知性、有效、实用
“挖掘出的信息越出乎意料,就可能越有价值”
通常数挖任务可以分成
预测型任务
:回归、分类、离群点检测
描述型任务
:聚类分析、关联分析、烟花分析、序列模式挖掘
上述两大类任务中的子任务,会在接下来系列博文中逐一介绍
在这里先说明聚类和分类的区别
:
聚类:是一种无指导(监督)的观察式学习,无预先定义类。
分类:是一种有指导(监督)的示例式学习,有预先定义类。
先提一个概念:
知识发现:KDD:Knowledge Discovery in Database
指,从数据中发现有用知识的整个过程。
而 知识发现的整个过程
可以从技术角度
和商业角度
来看:
技术角度,知识发现七步诗:
数据清洗(data clearning)
。
清除数据噪声和与挖掘主题明显无关的数据。
数据集成(data integration)
。
将来自多数据源中的相关数据组合到一起。
数据转换(data transformation)
。
将数据转换为易于进行数据挖掘的数据存储形式。
数据挖掘(data mining)
。
利用智能方法挖掘数据模式或规律知识。
模式评估(pattern evaluation)
。
根据一定评估标准从挖掘结果筛选出有意义的相关知识。
知识表示(knowledge presentation)
。
利用可视化和知识表达技术,向用户展示所挖掘的相关知识。
商业角度,数据挖掘三部走:
数据收集、 知识提取、知识辅助决策
所以,数据挖掘是知识发现过程中一个重要的环节!!!不要把二者混淆或者等同
数据挖掘技术,从一开始就是面向应用的。而且应用很广
在商业领域中的应用:
在计算机领域中的应用:
在它领域中的应用
虽然数据挖掘具有广泛应用,但它绝不是无所不能,
首先数据挖掘仅仅是一个工具,而不是有魔力的权杖;
其次数据挖掘得到的预言模型
可以告诉你会如何 (what will happen),但不能说明为什么会(why);
再者数据挖掘不能在缺乏指导的情况下自动地发现模型。
本篇结束
本文发布于:2024-02-02 08:28:31,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170683371442578.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |