Sanmisan's tree

Keep updating the site would be a good idea?

chitchat
这里做个不错的笔记分享地方吧以后。
Read more

Cross-Validation(交叉验证)

Coding things
转载自bigdataage的博客交叉验证(Cross-Validation): 有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。 ...
Read more

Can We Copy The Brain?

AI
最近教授推荐阅读了IEEE SPECTRUM六月份的特刊,主题非常明确:我们能否制造出会像我们一样思考,具有智能的机器?换言之,我们能否在保留基于晶体管的硅基处理器强大计算能力的同时,使处理器拥有大脑的智慧。 特刊中的文章对人工智能的定义分为两个阶段。首先是具备真正意义上智能的“功能”,比如 ...
Read more

Things gonna be changed

chitchat
这段时间沉迷折腾各种网络嵌入的方法。不得不说非常喜欢且感恩这种可以一心去钻研一件事儿的机会。 然而在另一方面,却始终无法避免人与人之间无聊且无谓的一些纠缠。最近深刻的感受到“物以类聚,人以群分”这句话的意义。也近距离感受到人们无意识的恶意能对一个集体产生多么糟糕的影响。看着充满恶念的小生灵挣 ...
Read more

多标签分类(Multi-label classification)性能评价中的宏平均(macro-average)与微平均(micro-average)

Coding things
转载自CSDN的博主天才暴风的文章 首先,论文中的表述如图: 通常,我们在评价classifier的性能时使用的是accuracy,考虑在多类分类的背景下 accuracy = (分类正确的样本个数) / (分类的所有样本个数) 这样做其实看上去也挺不错的,不过可能会出现一个很严重的问 ...
Read more

Online algorithm(在线算法)小记

Coding things Deepwalk
在看Deepwalk时发现这其实也是一种在线算法,刚好记录一篇笔记区别一下在线算法和离线算法。 1. 在线算法在计算机科学中,一个在线算法是指它可以以序列化的方式一个个的处理输入,也就是说在开始时并不需要已经知道所有的输入。相对的,对于一个离线算法,在开始时就需要知道问题的所有输入数据,而且 ...
Read more

深夜闲谈

chitchat
如果是几年前……累的时候喜欢乱七八糟写一堆东西来解压。现在想试着曾经的方法,结果只有发会儿呆,然后看看时间赶紧睡觉。。上学真好,读书真好。
Read more

初探网络节点相关性计算之Deepwalk

Network Embedding Deepwalk Word2vec
在自然语言处理、文本挖掘中,常常使用词向量作为单词(Word)内在含义的表达,从传统的向量表达到近几年的词嵌入(Word Embedding)表达,词向量已经作为一种文本的常用特征得到广泛应用。类似的,一些研究者希望通过网络结构中的连接关系,得到网络中顶点(vertex)的向量表示,作为基本 ...
Read more

中文测试

chitchat
这是一篇中文测试。也是一篇图片和banner的测试。
Read more

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer ...
Read more