文章類似度算出(速攻ハック版)

文章A文章B

ご案内

文章Aと文章B、2つの文章の類似度(パクリっぷり)を、大まかに見積もれます。コピペの改竄程度の場合は、70%を超える数字が出ると思われます。コピペレポート撲滅などにご利用ください。

仕組み

similar_text()に投げる前に、kakasiで簡単に形態素解析をしています。っていうか、これだけでかなりの精度になることが驚き。

作った人:中川 譲
公開日:2005-07-01