文章Aと文章B、2つの文章の類似度(パクリっぷり)を、大まかに見積もれます。コピペの改竄程度の場合は、70%を超える数字が出ると思われます。コピペレポート撲滅などにご利用ください。
similar_text()に投げる前に、kakasiで簡単に形態素解析をしています。っていうか、これだけでかなりの精度になることが驚き。