[WIP]文書間類似度の参考文献

最近、仕事で記事レコメンドアルゴリズムをコンテンツベース(文書間類似度)を用いて実装して、記事CTRを大幅(高いものだと700%くらい)に上げられた。 そのとき調べたことを雑にまとめておく。

論文

文書間類似度とはなんぞやを過不足なくまとまっていて良い。

OM-basedのためのtext tilingについて。