darts-clone内存占用减半的双数组trie树实现

trie树是一种常用的词典存储逻辑结构。双数组trie树是trie树的一种性能较好的具体实现方法。
由日本学者发明,知名NLP工具CRF++的词典即是由此实现。
CRF++所用的darts是实现双数组trie树的一份代码(文档中文翻译),整个词典就是数组元素由两个int组成(即“双”数组名字的来历)。
darts-clone有与darts相同的接口,但词典数组由一个int搞定,空间减小一半的同时速度还快些。

关于trie树与双数组trie树的原理非一两句话能介绍透彻,不过好在网上的资料都比较多,不难找到。 本文想介绍一下darts-clone用了啥黑科技达到这种效果的。

閱讀全文 »

创建此博客

记录大致的流程如下,相关的网页还比较多。

  • 安装Node.js
  • 安装Hexo
  • 配置主题
  • 安装部署到git的插件
  • 写文章,生成,测试,部署

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

閱讀全文 »

my first post

这是我的博客吗

可以随便写些啥东西了