2006.05.12

Googleブック検索

Google Book Search(元Google Print)の日本語版が年内にサービス開始するようです。

このプログラムにはISBN(日本図書コード)を持つ書籍を発行している出版社であれば無償で参加できる。書籍のスキャン費用やGoogleブック検索への登録に関しても無償という。今回、パートナープログラムや書籍登録の仕組みが一通り整備されたことで、今後グーグルは出版社に対して参加を働きかけていく。
(略)
また、欧米で提供しているGoogle Book Searchでは出版社からだけでなく、いくつかの大学付属図書館からも著作権の切れた書籍を中心として提供を受けているが、日本では現在のところそうした計画はないという。
ITmediaニュースより。)

大学図書館が協力して、著作権切れの図書が提供されるとすんごくうれしいんですが、そこまではまだいってないようです。東大か京大か早稲田か慶応がどどーんと協力してくれたりするとうれしいんですが。あるいは国会図書館の近代デジタルライブラリー全面協力とか。無償でやってくれるんですから、積極的に参加して産学協同じゃーいとかのたまってほしいなあ。

あと個人的には、マンガのスキャンをやって、台詞など文字部分をテキスト化してくれたりすると、もう最高なんですが。

| | コメント (0) | トラックバック (1)

2006.04.02

やっぱり貸本形式はしんどいか?

LIBRIe用の電子書籍店舗Timebook Townが、とうとう貸本形式だけってのをあきらめて、LongTimebook(ロングタイムブック)というサービスを貸本形式と並行して始めることにしたようです。その内容はTimebook Townの会員でいる限りは書籍データをずっと保有できるというものです。買い取りじゃないってのがなんですが、会費自体は無料ですし、Timebook TownのサービスがなくなるというのはまあLIBRIeの事業が頓挫するようなものですから、実質買い取りであると信じたいところです。図書館等での利用を考えると、期限付きの貸本フォーマットは悪くないんですが、正直、あくまで買い取り方式の補助としての位置づけの方が妥当だと思うんですよね。。。
そうそうそれと、結局携帯サービスも始めていました。せっかくの電子書籍なんですから、ワンリソースマルチユースにしてくれればいいのにと思うんですが、なかなか難しいのでしょうか。

海外では電子書籍端末としてSony Readerを投入しています。海外でも電子書籍市場はイマイチのようで、起爆剤として期待されてるらしいのですが、端末の使い勝手には問題があるようですし、LIBRIeとは端末もサービスも違ってしまっています。いい加減iPodを見習って、グローバルな利用を想定してほしいんですけど、残念なかぎりです。せっかく著作権管理機能を盛り込んで海賊版が生まれ得なくしているのに、その上市場を閉じなくてもよいのではないでしょうか。
新しい端末を出すときに統合とかしてくれないもんでしょうか。でも、後発のSonyReaderにしても端末に本文検索機能はなく、Σブックと比べて書籍フォーマットの形式が基本テキストという電子書籍として非常に優位な特徴をまるで生かす気がないところを見ると、若干不安です。うう、もったいない。

| | コメント (0) | トラックバック (0)

2006.02.20

T書体フォントのプレスリリース

TRONSHOW2006で公開されたT書体フォントに関する報道資料が公開されていました。前のエントリで参考にした紙版の資料と同じものです。

| | コメント (0) | トラックバック (0)

2005.12.16

TRONSHOW2006で見たぞ漢字12万字

漢字12万字が気になって、最終日30分前に駆け込みでTRONSHOW2006を見てきました。パーソナルメディアのブースに行ってみると、超漢字に12万字がしっかり搭載されてました。

さて、ブースでもらった報道用資料によると、12万字のフォント、T書体フォントの内訳は以下の通りでした。
まずGT書体が78,675字。
次に非漢字文字セットが1,814字。その内訳は以下の通りです。

JIS X 0213(第一面非漢字)+JIS X 0212:1,442字
濁点かな文字:204字
住基変体仮名:168字

そして宋明異体字・金文通釈文字セットが35,160字です。
まず宋明異体字文字セットとして以下の4つの異体字字典にもとづいたサブセットが用意されています。
龍龕手鑑:15,117字
篇海:12,837字
碑別字:4,190字
宋元以来俗字譜:2,355字

各サブセットは元の字典に収録されている文字からGTに収録済みの文字を省いたものとなっているそうです。各サブセット間で重複した文字があった場合の対応については特に記されていませんでした。
ブースにいた担当の方の話では重複してもそのまま収録されているんじゃないかとのこと。実際はどうなのか分かりません。
次に金文釈文が661字。白川静せんせいの『金文通釈』に基づいたそうです。
宋明異体字や金文釈文文字セットについては、部首および画数による文字検索ができる超漢字用ツールが用意されています。
このうちGT以外の文字セットには新たにTRON文字コードが割り当てられています。

ブースではこれらの文字セットが超漢字上ですでに動いていたわけですが、実際の製品に搭載されるのは来春になるだろうとのことでした。フォントの公開よりも遅れるんじゃないかとの由。
ちなみにWindows用のフォントはGTフォントのように、JIS第一、第二水準にフォント切り替えで割り当てたものになりそうです。やっぱり。ただ、このあたり担当の方はきちんと把握されてはいないようでした。まあ超漢字と関係ないですもんね。しかしこちらとしてはいちばん気になるところだったりするわけで。
ちなみにディスプレイ上での確認なので、微妙なところでしたが、T書体の明朝・ゴシック・楷書はそれぞれきちんとできていたように見えました。印刷できれいにでるとうれしいです。ま、僕はあまり気にしないんですけども。

| | コメント (0) | トラックバック (1)

2005.12.13

漢字12万字の無料フォント

坂村せんせいによって「約12万字からなる世界最多の漢字フォント集」が作成されたそうです。

制作は東大東洋文化研究所が協力。日中の代表的な辞書などに収録される8万字のほか、宋や明の時代の文献からも3万5000字を収録した。フォント集は明朝体、ゴシック体、楷書(かいしょ)体で構成し、基本ソフト(OS)に関係なく利用できる。

NIKKEI NET(via /J

GT書体じゃない点がすばらしいです。でもなあ、記事によれば「14日からソフト開発会社などに無償公開する」そうで、てことは個人は対象に入ってないんですかねえ。GPLで公開すればいいのに、どうしてわざわざ評価を落とすことをするんでしょうか。何とも残念です。天下の東京大学、けちくさいことは言わず、「フリー」で公開してもらえないでしょうか。

【追記】:12/14

T書体フォントに含まれるのは、東京大学多国語処理研究会によって制定された「GT文字セット」の78,765字に加え、江戸時代および中国の宋・明・清時代の文献から抽出された漢字のうちGT文字セットに含まれない「宋明異体字」が34,499字、白川静著『金文通釈』を材料とした金文研究のための「金文釈文文字」661字、そして、変体仮名や、マンガの表現に見られる濁点仮名(「あ゛」を1文字で表したものなど)など非漢字文字1,814字の計 115,739字。それぞれの字について「T明朝体」「Tゴシック体」「T楷書体」の3書体が用意されるので、公開されるフォントデータは合計約35万文字となる。
PCWEBより。

おお、これはなかなかすごい。「14日より東京国際フォーラムで開催される「TRONSHOW2006」で公開され、来春より同研究室のWebサイトを通じて配布する予定」だそうなので、NIKKEINETの記事は前半までのことで、一般公開は企業相手より遅れて行うということでしょうか。ブラボー。よかったよかった。来春が待ち遠しいです。
しかし心配なのは、Windows版が結局Shift-JISベースのTTF切り替え式だったりしないかといったことです。正直、どうせ切り替えでもUnicode3.2とか4.0ベースにして、1セット目だけでフル多漢字Unicodeフォントとして使えるようにしてほしいのですが。そうしてくれたら、まさに坂村せんせいは神!ですが。。。

| | コメント (1) | トラックバック (1)

2005.11.09

著作権侵害か学問擁護か?

Google Printの図書館全蔵書電子化プロジェクトに関して、

どの著作権の専門家もGoogleが危ない橋を渡っていると考えているわけではない。実際のところ、今回のケースをめぐっては、法曹界の意見も一致していない。この争いは結局、「Googleが世紀の著作権侵害者になろうとしているのか、それともウェブ検索技術によって無名の書籍にも日の目を見せようとする学問擁護者なのか」という1つの素朴な疑問にたどりつく。
CNET Japanより。

全ての研究者が誠実であれば、このサービスにより目にとまった書籍を購入するかもしれませんが、しかし、現実には。。。最悪のケースとしては日の目を見ても数冊しか売れなかったという落ちが想定できるでしょう。それでもましといえるかもしれませんが、ある程度は売れる高価な学術書籍はどうなるでしょうか。売れ行きがただでさえ鈍っているそうですが、それに拍車をかけることになるのでは、と思ってしまいます。
まあハードカバーに金文字でどっかーんみたいな出版をやめて、ペーパーバックよろしく廉価な出版形態を推進し、評価は内容を第一として決して本の作りで差別しない、という意識を周知できれば学術書の電子化の未来は明るいと思うのですが。どうしてでしょうねえ。

| | コメント (0) | トラックバック (0)

2005.11.07

Amazonが本をページ単位で販売?

CBS MarketWatchによると、オンライン書籍販売大手アマゾン・ドットコムは3日、インターネット利用者が、本を1冊丸ごとではなく、ページ、または章(チャプター)単位で、必要な部分だけ購入できるサービス「アマゾン・ページズ」を来年から開始すると発表した。アマゾンでは、「例えばビジネスマンが、ビジネス書のベストセラー数冊からマーケティングの章だけ読みたいと思えば、その部分だけ買うことができる」としている。
livedoorニュース(via 404 Blog Not Found)より。 論文集の欲しい論文だけ買えると確かにうれしいですが、おそらく学術書はこうした動きに載せるのは難しいように思えます。ペイしないんじゃないかと。紙で出さずに電子出版のみで、なら可能性はあるのかなあ。でも学術出版って商売でやってないし、ハードカバーで出版したいとかいった欲望(いい迷惑だけど分からなくもない)も含めて出版文化でしょうから、その継承となると、電子出版でいいでしょ、とは言い切れないところです。CGあるから油絵いらんよね、とはならないわけで。小飼さんが書いてるように筋としてはGoogleよりAmazonでしょうけど、学術出版の場合はどっちでも問題は残るように思えます。 もっともページ売りだけではなく、
アマゾンはまた、ネット利用者の選択肢を増やすため、購入した本(印刷物)のデジタル版も利用者に提供するサービス「アマゾン・アップグレード」を始めるとしている。アマゾンでは、一例として、定価20ドルの本では、1.99ドル足した料金でデジタル版が手に入るとしている。
とおまけつきもはじめるそうです。これ、すでに買ってしまった本に対しても適応してくれるとうれしいなあ。2万円超える洋書を買ったばかりなもので。 このサービス、二次配布を制限して、紙の本を買ったらその電子版も使えるようにするとかしてくれるんだったら出版社にとっても損はないでしょうし、むしろ図書館で必要なところだけコピーしてすませるより買ってしまおうという気になりますし、買った学術書の検索やコピペができるようになれば、ずいぶん研究する上での助けになりますねえ。いいなあ。日本のAmazonでもやってほしいなあ。

【追記】:11/9

また、世界最大の一般書籍の出版社であるRandom Houseも、同社の書籍をインターネット上で有料公開するビジネスモデルを明らかにした。
CNET Japanより。
そうそう、だいぶ前に言及済みですが、紙の書籍の電子版提供だと、JapanKnowledgeが複数の辞書(白川静『字通』なんかも)や平凡社東洋文庫を利用料定額で読み放題検索し放題です。またリブリエやシグマブックなどの専用端末による電子出版事業がこうした動きとどう関わってくるかというのも気になるところです。いっそ協業したら?と思うんですが、どうでしょうね。

| | コメント (0) | トラックバック (0)

2005.11.06

大英図書館の蔵書がデジタル化!

Microsoftは11月4日、大英図書館との戦略提携を発表した。2006年中に大英図書館の蔵書のうち2500万ページをデジタル化して検索できるようにし、将来的に対象ページを増やしていく計画。

 両者が協力して、著作権が消滅した書籍約10万冊をデジタル化。MSNの新しい書籍検索サービスMSN Book Searchで本文を検索できるようにする。来年にβサービスの公開を予定している。

ITmediaニュースより。

Microsoftもどかんと来ました。Yahoo!の主導する書籍電子化プロジェクトにも参加しています。同プロジェクトはInternetArchiveが関わっています。著作権の切れているものから入れていくというのは、足かせになる反面、仮に単なるパフォーマンスだとしても古典が注目されるわけですし、僕らみたいな古典研究者にはメリットとなるところが多く、うれしい傾向と言えるでしょう。

| | コメント (0) | トラックバック (0)

2005.11.04

Google Printで著作権切れの書籍の全文検索!

公開されている書籍は、ハーバード大学/スタンフォード大学/ミシガン大学/オックスフォード大学の大学図書館、およびニューヨーク市立図書館など、 Google Printのパートナーの蔵書が中心。ミシガン大学に収められている南北戦争の連隊史、スタンフォード大学所蔵の議定書や政府のドキュメント、ハーバード大学図書館のHenry Jamesの著作などが含まれる。本文の全文検索が可能であり、 たとえばニューヨーク市民の自伝を集めた「The Wealth and Biography of the Wealthy Citizens of the City of New York」では、書物内をさらに「Bankers(銀行家)」や「Grocers(食料雑貨店主)」などで絞り込める。
Google、パブリックドメインの書籍などを「Google Print」で公開」(Yoichi Yamashita、MYCOM PC WEB)より。 Google Printがんばれ~。一私企業がという批判があるにしても、そもそもどこも今までやってくんなかったじゃんと反論できる訳で、非常に応援したいです。だいたい複数企業でやったところで継続的にできるかどうか心配しなくちゃいかんのは同じこと。立ちゆかなくなったときに、データを公共機関に回収できるような(そして別の企業を探せるような)仕組みをきちんと作ればいいんじゃないかと思う次第です。 国会図書館の近代デジタルライブラリーなんか、すでに画像は気前よくどどーんと公開してる訳ですから、Googleと共同事業を立ち上げて電子テキスト化を推進してくれないもんでしょうか。

| | コメント (0) | トラックバック (0)

2005.11.02

Amazon.co.jpで書籍全文検索!

Amazon.co.jpで「なか見!検索」と称して、一部書籍の全文検索ができるようになりました。

開始当初の参加出版社数は講談社、ソフトバンククリエイティブ、日経BP出版センターJohn Wiley & Sons、Simon & Schusterなど約280社。現在、同サービスの対象となっている書籍は、同社が扱う書籍800万冊のうち13万冊だが、アマゾンジャパンのメディア・ディレクターを務めるローレン川崎氏によれば「出版社とさらなる提携を図り、対象書籍の数を増やしたい。今後は、雑誌を取り扱う可能性もある」という。なお、対象書籍に占める和書と洋書の比率や、参加出版者数における国内と海外の出版社の割合は公表していない。
INTERNET Watchより。
 
おお、すばらしい。試してみたところ、講談社が参加していることで、学術文庫の中身がヒットします。おお。
学術系の出版社はどのくらい参加してるんでしょうか。大手も岩波とかどうなんだろう。ともかく、ますますの発展を祈念いたしたい、て感じです。
ただ残念なのは、どうもShift JISの範囲までしか文字は通してくれないようです。古典研究者としては何とかutf-8ベースに移行して、多漢字環境の実現に尽力してくれないかな~と期待します。いや贅沢ですが。でももったいない話です。古典でなくても使う機会とかあると思いますし、文化事業的な位置づけもあわせて行うのは出版事業としてもマイナスにはならないと思うのですが。

【追記】:11.01
ITmediaにも記事が。

| | コメント (2) | トラックバック (0)

より以前の記事一覧