<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom"><title type="text">博客园_waemz</title><subtitle type="text">my</subtitle><id>http://feed.cnblogs.com/blog/u/26056/rss</id><updated>2010-01-15T00:50:14Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><generator>CNBlogs BlogServer</generator><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/"/><link rel="self" type="application/atom+xml" href="http://feed.cnblogs.com/blog/u/26056/rss"/><entry><id>http://www.cnblogs.com/waemz/archive/2010/01/15/1648248.html</id><title type="text">数学之美 系列十八 － 矩阵运算和文本处理中的分类问题</title><summary type="text">google要走了，转俩文章以作备份我在大学学习线性代数时，实在想不出它除了告诉我们如何解线性方程外，还能有什么别的用途。关于矩阵的许多概念，比如特征值等等，更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法，还是看不到可以应用的地方。当时选这些课，完全是为了混学分的学位。我想，很多同学都多多少少有过类似的经历。直到后来长期做自然语言处理的研究，我才发现数学家们提出那些矩阵的概念和算法，是...</summary><published>2010-01-15T00:50:00Z</published><updated>2010-01-15T00:50:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2010/01/15/1648248.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2010/01/15/1648248.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/29/1491854.html</id><title type="text">文本分类（二）特征权重量化器（文档转向量表示）</title><summary type="text">上一节做了分词器的实现，并实现了Simple、Standar、Cn、ICTCLAS几个分词算法。本节实现文档转向量表示，并命名为特征权重量化器，特征权重量化我只实现1个算法----TFIDF算法。</summary><published>2009-05-29T13:45:00Z</published><updated>2009-05-29T13:45:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/29/1491854.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/29/1491854.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/29/1491785.html</id><title type="text">文本分类（一）封装分词器</title><summary type="text">我自己简易封装了一个分词器，使用Lucene.Net.类图如下</summary><published>2009-05-29T10:14:00Z</published><updated>2009-05-29T10:14:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/29/1491785.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/29/1491785.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491509.html</id><title type="text">转嘉士伯的Java小屋写的关于编码的文章（三）网页文件的编码</title><summary type="text">接着上节的思路说，一个网页要想在浏览器中能够正确显示，需要在三个地方保持编码的一致：网页文件，网页编码声明和浏览器编码设置。</summary><published>2009-05-28T15:30:00Z</published><updated>2009-05-28T15:30:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491509.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491509.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491500.html</id><title type="text">转嘉士伯的Java小屋写的关于编码的文章（二）GB2312，GBK与中文网页</title><summary type="text">GB2312是对中国的开发人员来说很重要的一个词汇，它的来龙去脉并不需要我在这里赘述，随便Google之便明白无误。我只是想提一句，记得前一节说到编码字符集和字符集编码不是一回事，而有的字符集编码又实际上没有做任何事，GB2312正是这样一种东西！</summary><published>2009-05-28T14:58:00Z</published><updated>2009-05-28T14:58:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491500.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491500.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491499.html</id><title type="text">转嘉士伯的Java小屋写的关于编码的文章（一）编码字符集与字符集编码的区别</title><summary type="text">需要再一次强调的是，无论历史上的UCS还是现如今的Unicode，两者指的都是编码字符集，而不是字符集编码。花费一点时间来理解好这件事，然后你会发现对所有网页的，系统的，编码标准之间的来回转换等等繁杂事务都会思路清晰，手到擒来。</summary><published>2009-05-28T14:57:00Z</published><updated>2009-05-28T14:57:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491499.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491499.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491498.html</id><title type="text">SVM入门（三）线性分类器Part 2</title><summary type="text">上回说到对于文本分类这样的不适定问题（有一个以上解的问题称为不适定问题），需要有一个指标来衡量解决方案（即我们通过训练建立的分类模型）的好坏，而分类间隔是一个比较好的指标。</summary><published>2009-05-28T14:52:00Z</published><updated>2009-05-28T14:52:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491498.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491498.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491497.html</id><title type="text">SVM入门（二）线性分类器Part 1</title><summary type="text">线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念. </summary><published>2009-05-28T14:51:00Z</published><updated>2009-05-28T14:51:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491497.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491497.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/05/28/1491496.html</id><title type="text">SVM入门（一）SVM的八股简介</title><summary type="text">支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性（即对特定训练样本的学习精度，Accuracy）和学习能力（即无错误地识别任意样本的能力）之间寻求最佳折衷，以期获得最好的推广能力[14]（或称泛化能力）。 以上是经常被有关SVM 的学术文献引用的介绍，有点八股，我来逐一分解并解释一下。 </summary><published>2009-05-28T14:51:00Z</published><updated>2009-05-28T14:51:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491496.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/05/28/1491496.html"/></entry><entry><id>http://www.cnblogs.com/waemz/archive/2009/03/06/1404821.html</id><title type="text">人工神经网络框架AForge学习(三):后向传播学习算法</title><summary type="text"/><published>2009-03-06T09:30:00Z</published><updated>2009-03-06T09:30:00Z</updated><author><name>waemz</name><uri>http://www.cnblogs.com/waemz/</uri></author><link rel="alternate" href="http://www.cnblogs.com/waemz/archive/2009/03/06/1404821.html"/><link rel="alternate" type="text/html" href="http://www.cnblogs.com/waemz/archive/2009/03/06/1404821.html"/></entry></feed>
