本稿は中国特許データ(1985年~2016年)の発明者情報について、機械学習によって同一発明者の識別作業を行った。手作業を作成した教師データを用いて、機械学習の7つの方法(Naïve Bayes, Logistic, LDA and QDA, Random Forest, Ada BoostとGradient Boosting)のパフォーマンス ...