バイオインフォマティクス実習資料(平成20年度、清水謙多郎)

文献データベースの基礎

1. PubMedの利用

NCBIのサイト(http://www.ncbi.nlm.nih.gov/)にアクセスして下さい。以下のような画面が表示されます。
ここで、上のメニュー欄の「PubMed」を選択して下さい。


以下のような画面が表示されます。


次に、ヒトゲノムのドラフト解読を行った論文の検索をしてみましょう。
まず、「Human Genome」をキーに検索を行ってみます。


5万件以上のヒットがあり、さらに条件を絞ります。
「Advanced Search (beta)」をクリックします。


以下のような画面が表示されますので、そこで、思いつく著者(Collins)、ジャーナル(Nature)、発表年(2001)を入力します。
余裕があれば、「Add More Search Fields」をクリックし、どのような項目が入力できるか、確かめてみましょう。


以下のような検索結果が表示されます。


ここで、「Details」のタブをクリックしてみましょう。

「Query Translation」に、内部で実際に行われている検索が表示されます。「human genome」の指定に対しては、MeSH用語の「genome, human」または「All Fields」の「human genome」、さらに「All Fields」の「human」と「genome」のANDを調べていることがわかります。この例にはありませんが、例えば、 「bioinformatics」に対しては、タイトルとアブストラクトの中の「computational biology」またはMeSHの「computational biology」も検索され、「E. Coli」に対しては、同じく「escherichia coli」も検索されます(大文字・小文字の区別はありません)。

MeSHMedical Subject Headings)とは、MEDLINE に収録されている論文の主題を表すための、生物医学分野の統制語彙(control language)です。

上で検索した3つ目の論文がどのようなMeSH用語をもっているか調べてみましょう。3つ目の論文を選択します。そこで、左上の「Display」が「AbstructPlus」になっているところを「Citation」に変更して下さい。

これにより、アブストラクトの下に、この論文がもつMeSH用語が表示されます。


これらのMeSH用語は、この論文の内容を表しています。「*」は、MeSH Major Topicを表しています。

2. Google Scholarの利用

Google Scholarは、学術論文検索用のサーチエンジンで、2004年から実験的に運用が行われています。学問分野はとくに限っていません。通常の Googleに対し、検索オプションとして、著者、出版物名、日付が追加されています。通常のGoogleの検索と同じく、クエリに対する適合度の高い順 に検索結果が表示されますが、Google Scholarの特徴は、著者、掲載された出版物、引用されている頻度なども順位に反映されます。

Google Scholarのサイト(http://scholar.google.com/)にアクセスして下さい。



キーワードに「human genome」と入力して、「Google 検索」ボタンをクリックして下さい。以下のような検索結果が表示されます。


ちなみに、2008年7月21日の時点では、約1,300,000件のヒットでした。先ほど、PubMedで検索した論文が4件目に位置していることに注意して下さい。より詳細な検索については、トップページの「Scholar 検索オプション」をクリックすると、以下のページが表示されます。