吴文洁

Garden of Eden 自由 平等 尊重

改-机器学习-决策树(Python实现)

| Comments

什么是决策树

  • 决策树(Decision Tree)是一种树型分支结构的决策模型。
  • 它以信息论中的香浓熵作为基本划分依据。
  • 它的优势是模型便于理解、分类效果优异、生产上实现简单等。
  • 著名算法:ID3、C4.5、C5.0、CART等
  • R:C50、rpart
  • Python: sklearn(tree)

效果

  • tree

改-机器学习-逻辑回归(Python实现)

| Comments

简介 什么是逻辑回归(Logistic Regression)

  • 逻辑回归模型是广泛运用的分类器,它在线性模型基础上,结合了sigmoid函数(S型)而产生的。
  • 逻辑回归模型优势是使用简便、求解快速、容易理解,所以使用广泛。
  • 推荐使用:
  • R:glm包(广义线性模型)中选用binomial(二项分布族)
  • Python:scikit-learn (sklearn)中选用linear_model.LogisticRegression

白相Raspberrypi-4-装个眼睛哦

| Comments

装个眼睛?

  • 使用USB摄像头当作树莓派的眼睛。
  • 利用OPENCV作为树莓派感知外部世界图像的处理工具。
  • 本片文章目的是使得Pi能识别移动物体,具备入侵检测的功能。
  • 参考文章 1 2 3

白相Raspberrypi-1-安装要点

| Comments

前言

  • 随着云、物联网、编程教育等事物的兴起,树莓派(raspberrypi)作为人们实现想法、控制硬件的玩具越来越火。
  • 由于无聊,也想试着玩玩树莓派,就买了raspi 2b、传感器、面包版、杜邦线等。

改-TextRank文本摘要简介与应用

| Comments

文本摘要简介

  • Automatic Summarization 主要有两种方法
  • Extraction : 抽取式,提取文档中已存在的关键词、句子形成摘要。
  • Abstraction: 生成式,建立抽象的语意表示,使用自然语言生成技术,形成摘要。

TextRank的文本摘要

  • TextRank的方法属于graph-based Extraction。
  • 对文本中的句子重要性排序后得到摘要。
  • 权值为句子间的相似度,计算两个句子的内容覆盖率。
  • TextRank关键字提取的不同:考虑了句子间的权值。

改-TextRank文本关键字提取简介与应用

| Comments

TextRank与PageRank

  • TextRank脱胎于PageRank,受其启发应用于文本处理。–>论文
  • TextRank在PageRank的基础上,引入了边的权值概念,代表两个句子的相似度。
  • PageRank 公式
  • pagerank
  • TextRank 公式
  • textrank
  • 公式解释
  • 模型描述了一个有向有权图 G =(V, E), 由点集合V和边集合E组成
  • 图中任两点 Vi , Vj 之间边的权重为 wji
  • 对于一个给定的点Vi, In(Vi)为指向该点的点集合, Out(Vi)为点Vi指向的点集合
  • d为阻尼系数,代表从图中某一特定点指向其他任意点的概率,一般取值为0.85

简单的JAVA NOTEPAD 记事本

| Comments

前言

  • 人们一直会对JAVA有一种“丑陋”的错觉,特别是UI。
  • 但JAVA其实是强大的、多功能的、适合网络的语言。
  • 我们一简单的文本编辑器,管中窥豹,一探JAVA的UI设计。