« 2005年6月 | トップページ | 2005年8月 »

2005.07.26

最近の中国語OCRソフト

最近の中国語対応のOCRソフトで、けっこう注目してるのが「おまけ」のソフトです。MicrosoftのMS Officeやhpのプリンタ複合機のおまけOCRソフトはさすが多国籍企業の面目躍如といったところでしょうか、多言語対応で中国語もばっちりなんです。とはいえ、機能的にはまだまだといったところで、まず簡体字中国語については、MS Office付属のOCRソフトは認識率がイマイチ、hpの方は認識率ではOfficeを抜いてなんとか実用レベルでした。次に、繁体字中国語については、hpの方はそもそも縦書き未対応という実用性皆無なのに対し、Officeは縦書きしっかり読んでくれます。日本語OCRで無理に読ませて泣きを見るより、断然おすすめです。

hpのOCRソフトはReadirisというソフトをベースにしているようです。日本で購入する場合はeXpansys.jp で15,360円でした。このソフト自体はヘブライ語対応アドオンとかもあって何やらすごいんですが、元のこっちも縦書き対応かどうかは分かりません。
中国語に特化した市販ソフトなら、CROSS OCR(13,440円)がなかなか優秀で、パッケージを購入するなら絶対こっちですね。縦書きはもちろんOKですし、昔はダメだった繁体字中国語も何のその。このソフトでちょっと気になるのが、特に繁体字/簡体字を指定する必要がないところです。認識出力でテキストを指定するとエンコードがUTF-16になるあたり、あるいはGB18030ベースだったりして。うーん、難しい漢字使ってるテキスト読ませてみないと。

| | コメント (0) | トラックバック (0)

2005.07.19

著作権保護期間延長?

Matzにっき経由で、朝日新聞beの記事「保護期間延長で、埋もれる作品激増?著作権は何を守るのか」を読みました。beは前にも山形浩生さんが「著作権の「危機」って何だ」と問題提起してました。古典研究者のようなどうやってもベストセラーにはならないような本ばかりを必要としたり、古本屋でばか高い値段がついてる研究書を何とか電子化して研究史をきちんとやりたかったりする人種にとっては、非常に困ったことになりますねえ。

どうしても儲けたくって、保護期間のばしたいと言うんであれば、それ相応の代償を払うというのはどうでしょう。そうですね、例えば過去に遡って全出版物を国会図書館にデジタルデータで寄贈すること、あるいはそのための費用として出版による得られる収入の何%かを納める、とか。んで、出版停止された本については、著作権の有無に関わらずDRMで期限つけて借り出せるようにすると。著作権がきちんと切れていれば誰かがフリーでネットに出してくれたかも知れない作品の命を奪うような犯罪的行為をしようってんですから、出版社にもそれくらいのコストは持って欲しいもんです。あーでも、そのぶん、印税を削ったりして、作家側に負担をかけたりして。ううむ。

| | コメント (0) | トラックバック (0)

2005.07.09

東京国際ブックフェア2005

今年もブックフェア行ってきました。年を追うごとに人文書コーナーが小さくなっていくのが悲しいです。今年は電子出版1/4、児童もの1/4、大手出版社1/4 人文・理工学術書1/4って感じでした。電子出版のブースもそこはかとなく低調でした。アドビのCS2紹介のブースがいちばん大きかったぐらいですか。僕が注意してみてたのは、電子ブック関連のブースだったんですが、ソニーは凸版印刷か大日本印刷のブース(どっちだったっけ?)の一部で去年までと特に変わりのない宣伝をひっそりやってたぐらい(オーサリングツールのBookCreatorの方は、自費出版のeブックランドでおまけで紹介)で、特に新しい展開もなくいささか心配になりました。値段安くて本文検索も可能な二号機を出して欲しいんだけどな。
一方、松下のΣBookは新機種をちょっとだけ展示してました。
p1000095.jpg
1画面で視認性の高いカラー液晶と、現行機種をまったく踏襲していないデザインになってました。やっぱり、最初の機種は評判悪かったのねという感じ。LIBRIeユーザーの僕もこの新機種にはちょっと心惹かれました。ネックは値段でありますが。また学術利用にしか興味ない僕にとっては、T-Timeによる書き出しとの差異を図れないとあまりメリットないです。その書き出しもPSPのきれいな液晶に書き出したのを見たのですが、うーん、読むだけなら、LIBRIeのe-inkの方がいいかも。
電子ブックでは、シャープのXMDFがいちばん熱心でした。オーリングツールの宣伝やら、DSの楽引辞典にも使われてますといった宣伝やら、専用ブースを出してたのもここだけでしたし。がんばって~。

電子ブックに期待している最大のポイントは、既存図書の電子化を進めることができるからなんですね。Google Printのような本の中身を検索できる、研究者にとって涙がちょちょぎれるくらいうれしいサービスをどう日本で展開できるかを考えてみると、例えばこうした電子ブックとの連携だと思うんですよね。ホントは紙の本の検索ができるとうれしいんですが、英語の書籍と違って、機械的にどかどかとOCRして電子化していくわけには行かない。かかるコストが全然違うと思うんです。でも電子ブックなら、すでにきちんと電子化されている訳ですから、その問題はクリア。電子ブックを販売してる側にしても、現行の販売サイトでは中身の検索サービスないですよね。それをGoogleと提携してやる。検索していいなと思った本をすぐにダウンロードできますよ、と。ΣBookも最初は画像のみだったんですが、文字コンテンツについては、ボイジャーのテキストベースのドットブックフォーマットを採用したそうです。なので、上の三大電子ブックのすべてに対して、こういうサービスが理屈の上では可能なんですよね。やってくれないかなあ。

| | コメント (0) | トラックバック (0)

2005.07.02

「校訂という行為と著作権との関わり」メモ

漢情研の著作権講座の三回目が25日に開催されました。当日は僕は別のシンポジウムで報告していたので参加できず残念至極だったんです(だって懇親会でのフランクな議論まで参加してなんぼですもん)。秋に出る会報での詳しい報告が今から楽しみです。会員BBSでの下準備の議論は追っかけていましたが、どうせ出れないからいいやと特に発言せずに終わったもんで、忘れる前に思ったことをメモしておきます。

さて、メルマガ7月1日号によると以下のような展開だったようです。

まず始めに秋山陽一郎氏による「中国学で言うところの校訂という行為」 についての概論が説明されました。これは本会BBSでの議論を踏まえ、校訂と いう行為が実は複数の概念と用語に分かれること、また実際の事例を踏まえ つつ、校訂には高度な学術的な創造性が含まれる場合もあることなどを中心 に述べられました。

中国学以外の古典学・文献学の場合と比べてみないと何とも言えませんが、一般に「校訂」と呼ばれる行為を中国学では細分化しているということそれ自体が、中国学が校訂を重視した知の体系であることを意味します。そもそも「創造性」があるかどうかという問いは独創性を重んじる近代的な(いや「現代」的かな)価値判断で、真理に奉仕する場合は誰でもそこに辿り着ける(もちろん最初から可能性のない人間はいることも認めているけど)ことを前提とするので、「創造性」は決して重要な価値じゃないと思います。もちろん後の時代からみると、校訂の伝統は個々の学者が独自の解釈を行ってきた歴史なのだけど、当事者の感覚はどうだったのか。このあたり、「経典」を校訂していた近代以前と、「史料」を校訂するようになった近代以降では違ってくるでしょう。もちろんこの二つの態度は全面的に切り替わった訳ではなくって、現在でも儒教経典の校訂と小説戯曲の校訂では校訂者の文献に対する姿勢が違ってるように思えます。
次に石岡克俊氏より、「校訂作業の法的取扱い」と題する講演が行われま した。その中で、「校訂権とは、【校訂をする権利】ではなく、【校訂者の権利】である」とする基本的定義が確認され、従来の出版物における校訂者 の権利の事例を挙げ、従来の事例はあくまで民法で言うところの「私的自治」 の範囲に過ぎないこと、そして「校訂作業の法的評価」として、学術的成果 の利用に関する自主的ルールの必要性を説明していただきました。

「巨人の肩に乗る」ことは洋の東西を問わず学問において基本姿勢であるわけで、そうした立場と著作権という経済的な要請がぶつかっている不幸というのも考えないといけないのでしょう。名和小太郎『ディジタル著作権』 (amazon, bk1)などでそうした議論がありました。
利用に関する議論をすすめていくと、評価の問題も大切になってくるでしょう。校訂には原典解釈の作業も含まれますから、つきつめていくと翻訳になるわけで、学術的評価の兼用には校訂だけでなくその延長として翻訳までを射程に入れて議論すべきで、そうなると「独創的」な論文と翻訳とでは翻訳の評価が低い現状が問題となります。西洋系の人文学では確実にそのようですが(何かの本の対談で詠んだけど、その本が発掘できてません。とほほ)、中国学ではどうなんでしょう。校訂から翻訳までを含めた注釈稿については、学術的作業として難易度が高いと考えてるマスタークラスの先生は何人もいらっしゃるでしょうけど、現実には本にでもまとめないかぎり業績としてきちんとカウントされないように思えます。小分けに学術雑誌に投稿したって、論文としてカウントしないですもんね。
僕なんかはそこそこの翻訳でもいいから、びしばし公刊される状況があった方が業界全体の発展にはいいと思うんですけども。でも現状では業績にならないんで、結局、研究者が学術的成果を「趣味」としてやっているという、なんだか奇妙な状況です。有職者はいいですが、求職者ではつらいもんがあります。僕も兼業研究者ですんで、どっち優先かというと、結局論文です。プロジェクト杉田玄白のような趣味でここまでやってる人たちを見るにつけ、研究者の端くれとしてこれでええんかおいと思ってしまうんですが。
と、何かずれてきたところでどっとはらい。

| | コメント (2) | トラックバック (0)

« 2005年6月 | トップページ | 2005年8月 »