楽寂静ノート17:論文剽窃検知のオンラインツールの効用

 昨今の学術論文の剽窃に関する問題は、研究者に大きな衝撃を与えた。その影響を受けてか、私たちの大学でも「iThenticate:アイセンティケイト」という論文剽窃検知ツールが導入され、博士論文を提出する際には、指導教員により自主的に検査されることになった。「iThenticate」は、公開済みの著作物のフルテキストデータベースと呼ばれる膨大な情報と照合することで、未発表原稿の剽窃をチェックするオンラインツールである。原稿をオンライン上にアップロードすれば、短時間で文章盗用、いわゆるコピーペーストの疑われる箇所が色刷りで表示される。

 

 先月末、国際雑誌に投稿していた論文が受理された。大学院生の博士論文の主要部分となるため、事務室からアクセスパスワードをもらって、原稿をチェックしてみた。生物科学系の原著論文は、「表紙」「要約」「背景と目的」「材料と実験法」「結果」「討論」「引用文献」「図の説明」「表」「図」の各セクションで構成される。このうち「引用文献」が既存の論文と高い類似性を示すことは容易に推定される。まず原稿全体を走査すると、所要時間は3分程度、類似性30%と表示された。果たして「引用文献」はすべて色刷り状態であった。「引用文献」を検知対象から外して再走査すると類似性は8%、「表紙」の著者の所属・連絡先住所、「材料と実験法」と「背景と目的」の一部に類似性が指摘された。これら指摘箇所は校正できない事実、実験法、研究背景の歴史的要約であり、検知から除外すると残りのセクションの類似性は1%以下となった。

 

 当研究室では論文投稿にあたり、関係者と論文のタイトル、投稿先、使用する図表、論旨の流れ等について詳細に討論にした後、First Author(筆頭者)が図表を含めて原稿の第一稿を作成する。次にCorresponding Author(責任著者)たる私が全体に渡って添削する。私の教育・研究者としての仕事の大半は、この作業に追われるといっても過言ではない。筆頭著者との複数回のやり取りの後、ネイティブ英米人による英文校正(有料)を経て脱稿となる。最終稿においては、「材料と実験法」と「図の説明」、および「表」と「図」を除いて、第一稿の痕跡は残らないのが常である。したがって、もし検知ツールが剽窃の疑いを検知したとすれば、その責任は私にあることが明白である。

 

 私たちの原稿の類似性の低い理由は、実験材料と研究内容の独自性が非常に高く、必然的に類似する著作物が限定されるからである。私の文章能力が秀でているわけではない。新たな原稿の作成にあたっては、過去の自身の論文にある表現や文章の再利用を極力避け、継続論文であっても「背景と目的」の記述がまったく同じにならないように工夫することが肝要である。一方、複数の研究室の共同研究で達成された共著論文においては、担当箇所以外のセクションについて、剽窃の有無を含めて添削や英文校正を行うことは、責任著者であっても簡単にできるものではない。ここに、論文剽窃検知ツールの利用と効用が期待されるところである。共同研究の執筆者が剽窃検知ソフトの利用を念頭におくだけでも、パラグラフ全部をコピーペーストするなどという行為はおのずから消滅してくものと思われる。

2014年8月18日