教師データの作成が難しそう
母数が足らないと特定の文字列の出現度だけから判定してしまったりするんじゃないか