2007年12月 7日

書籍のデジタル化「Universal Digital Library」

カーネギー・メロン大学などによる書籍デジタル化プロジェクト「Million Book Project」が、
サイト「The Universal Digital Library」を公開しています。

(Universal Digital Library)(一部抜粋)

The Universal Digital Library

For the first time in history, all the significant literary, artistic, and scientific works of mankind can be digitally preserved and made freely available, in every corner of the world, for our education, study, and appreciation and that of all our future generations.

Up until now, the transmission of our cultural heritage has depended on limited numbers of copies in fragile media. The fires of Alexandria irrevocably severed our access to any of the works of the ancients. In a thousand years, only a few of the paper documents we have today will survive the ravages of deterioration, loss, and outright destruction. With no more than 10 million unique book and document editions before the year 1900, and perhaps 100 million since the beginning of recorded history, the task of preservation is much larger. With new digital technology, though, this task is within the reach of a single concerted effort for the public good, and this effort can be distributed to libraries, museums, and other groups in all countries.

Existing archives of paper have many shortcomings. Many other works still in existence today are rare, and only accessible to a small population of scholars and collectors at specific geographic locations. A single wanton act of destruction can destroy an entire line of heritage. Furthermore, contrary to the popular beliefs, the libraries, museums, and publishers do not routinely maintain broadly comprehensive archives of the considered works of man. No one can afford to do this, unless the archive is digital.

Digital technology can make the works of man permanently accessible to the billions of people all over the world. Andrew Carnegie and other great philanthropists in past centuries have recognized the great potential of public libraries to improve the quality of life and provide opportunity to the citizenry. A universal digital library, widely available through free access on the Internet, will improve the global society in ways beyond measurement. The Internet can house a Universal Library that is free to the people.

The mission is to create a Universal Library which will foster creativity and free access to all human knowledge. As a first step in realizing this mission, it is proposed to create the Universal Library with a free-to-read, searchable collection of one million books, available to everyone over the Internet. Within 10 years, it is our expectation that the collection will grow to 10 Million books. The result will be a unique resource accessible to anyone in the world 24x7, without regard to nationality or socioeconomic background.

One of the goals of the Universal Library is to provide support for full text indexing and searching based on OCR (optical character recognition) technologies where available. The availability of online search allows users to locate relevant information quickly and reliably thus enhancing student's success in their research endeavors. This 24x7 resource would also provide an excellent test bed for language processing research in areas such as machine translation, summarization, intelligent indexing, and information retrieval.

It is our expectation that the Universal Library will be mirrored at several locations worldwide so as to protect the integrity and availability of the data. Several models for sustainability are being explored. Usability studies would also be conducted to ensure that the materials are easy to locate, navigate, and use. Appropriate metadata for navigation and management would also be created.


(Universal Digital Library)(一部抜粋)

The Universal Digital Library


現在まで、私たちの文化遺産の送信はこわれやすいメディアにおける限られた数のコピーによりました。 アレキサンドリアの炎は取消不能に古代の人の作品のどれかへの私たちのアクセスを断ち切りました。 1,000年後に、ほんの私たちが今日持っている紙の文書のいくつかは劣化、損失、および完全な破壊の破壊行為を乗り切るでしょう。 1900年の前の1000万未満のユニークな本とドキュメント版、および恐らく記録された歴史の始まり以来の1億で、保存のタスクははるかに大きいです。 新しいデジタル技術で、もっとも、ただ一つの協力の範囲の中にこのタスクは公益のためにあります、そして、すべての国にこの努力はライブラリ、博物館、および他のグループに広げることができます。

紙の既存のアーカイブには、多くの短所があります。 今日まだ現存する他の多くの作品が、まれであって、特定の地理的な位置で単に学者とコレクタの少ない人口に理解できます。 破壊のただ一つの奔放な行為は遺産の全体の線を破壊することができます。 その上、通念とは逆に、ライブラリ、博物館、および出版社はきまりきって男性の考えられた作品の広く包括的なアーカイブを維持しません。 アーカイブがデジタルでない場合、だれにはもこれをする余裕がありません。

デジタル技術で、男性の作品は永久に世界中の何十億人の人々にとってアクセスしやすくなる場合があります。 アンドルー・カーネギーと他の偉大な博愛主義者は、クオリティ・オブ・ライフを改良して、機会を市民に提供するために過去の数世紀の間に公立図書館の素晴らしい潜在能力を認めました。 普遍的なデジタルインターネットのフリー・アクセスで広く利用可能なライブラリは方法でグローバルな社会を測定を超えたところまで改良するでしょう。 インターネットは人々にとって、無料であることのUniversal図書館を収容することができます。

任務は創造性を伸ばすUniversal図書館とすべての人間の知識へのフリー・アクセスを創設することになっています。 この任務がわかることにおける第一歩として、それは100万冊の本の読むのを解放していて、探せる収集でUniversal図書館を創設するために提案されます、皆にとって、インターネットの上で利用可能です。 10年以内に、収集が10冊のMillionの本まで成長するのは、私たちの期待です。 結果は年中無休、24時間だれにとっても、世界でアクセス可能なユニークなリソースになるでしょう、国籍への尊敬も社会経済的なバックグラウンドなしで。

Universal図書館の目標の1つは入手できるところでOCR(光学文字認識)技術に基づく全文インデックスと探すことのサポートを提供することです。 オンライン検索の有用性で、その結果、ユーザは、彼らの研究プロジェクトへの学生の成功を高めながら、すぐに、そして確かに関連情報の場所を見つけます。 また、この24×7リソースは機械翻訳や、総括や、知的なインデックスや、情報検索などの領域での言語処理調査のための素晴らしいテストベッドを提供するでしょう。

Universal図書館がデータの保全と有用性を保護するために数個の位置で世界中映されるのは、私たちの期待です。 持続性のための数個のモデルが探られています。 また、ユーザビリティ研究が、場所を見つけて、ナビゲートしやすくて、材料は使用しやすいのを保証するために行われるでしょう。 また、ナビゲーションと管理のための適切なメタデータは作成されるでしょう。