先日のエントリでも触れましたが、Alfrescoを日本語環境で利用するためには、いくつかの設定作業が必要になります。
- メッセージの日本語化(=ランゲージパックの導入)
- ログイン画面の言語選択欄に日本語を追加
- 検索文字列の最小長を変更
- Luceneの日本語対応版導入
あたりが、必須となる作業になります。
1.のメッセージについては、先日のエントリのリンクから最新版のランゲージパックをダウンロード、解凍し、alfresco/tomcat/shared/classes/alfresco/messages フォルダへコピーするだけで完了します。
2.と3.の設定は、alfresco/tomcat/shared/classes/alfresco/extension/web-client-config-custom.xml.sampleを編集して行います。このxmlファイルのルート要素は<alfresco-config>ですがその直下に<config evaluator="string-compare" condition="Languages">という要素がありますのでさらにその下の<languages>に
<language locale="ja_JP">Japanese</language>
を追加することでログイン画面で日本語が選択できるようになります。
さらに別の<config>要素を追加し、
<config>
<client>
<search-minimum>2</search-minimum>
</client>
</config>
とすることで、検索時に2文字の単語での検索が可能になります。デフォルトでは英語圏の発想から3文字以上のキーワードしか受け付けないようになっています。最後に、web-client-config-custom.xml.sampleの最後の.sampleを取り除いたweb-client-config-custom.xmlという名前で保存することを忘れないで下さい。
4.についてですが、AlfrescoはJavaベースのオープンソース検索エンジンであるLuceneを利用しています。デフォルトではたとえutf8を利用していても日本語コンテンツのインデクシングには対応していません。そこで、lucene-jaというローカライズ版を利用し、形態素分析を活用するJapaneseAnalyzerか二文字区切りで機械的にインデクシングする(その代わり中国語や韓国語にも対応できる)CJKAnalyzerを利用することになります。
どちらも利用可能ですが、辞書の設定などが不要なCJKAnalyzerの方が簡単です。lucene-ja.jarをalfresco/tomcat/webapps/alfresco/WEB-INF/libにコピーし、alfresco/tomcat/webapps/alfresco/WEB-INF/classes/alfresco/model/dataTypeAnalyzers.propertiesを編集します。例えば、
d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.standard.StandardAnalyzer
となっているところを、
d_dictionary.datatype.d_text.analyzer=org.apache.lucene.analysis.cjk.CJKAnalyzer
とします。バージョン1.3からは原則的にこれらの設定変更はwebapps/alfrescoフォルダよりも上の階層でwarパッケージの内部を編集せずに行えるようにする方針になっていますが(messagesフォルダ等のあるsharedというのがそのためのスペースです)、このあたりに関してはまだ対応出来ていません。
以上の作業を行うことで、Alfrescoの日本語化は一応完了します。
# また、ある種のバッドノウハウとして.exeの1ファイルインストーラーは日本語名のフォルダの下では動作しないため、Cドライブ直下などに移してから実行する必要があります。よく引っかかる点なので、本筋とはずれますがメモとして記載しておきます。
(文責 Ishii Akinori)
レイアウトの問題で、dataTypeAnalyzers.propertiesの編集項目の最後が切れてしまってますね。
StandardAnalyzer と CJKAnalyzer が正しい表記です。
投稿情報: Ishii Akinori | 2006年7 月14日 (金) 19:37
はじめまして。
alfresco 試用してみているのですが、問題点がでてきました。
何か良い方法があればご教授ください。
実行環境 Sony Vaio VGN-FS53B
OS WindowsXP Homeedition SP2
JDK 5.0 Update 6
MySQL 5.0.24
Alfresco 1.3.0 Tomcat バンドル版
日本語パック V1[1].3_ja_JP_03.zip
OpenOffice 2.0
問題点[1] 日本語での検索ができない
7/14の「Alfresco 日本語環境での導入方法」を参考 にして
1. メッセージの日本語化(=ランゲージパックの導入)
2. ログイン画面の言語選択欄に日本語を追加
3. 検索文字列の最小長を変更
4. Luceneの日本語対応版導入
1と2はalfresco1.3.0では修正必要なしだった
3については指示通りの手順でできるようになった
4について
C:\alfresco\tomcat\webapps\alfresco\WEB-INF\lib に lucene-ja.jar をコピー
dataTypeAnalyzers.properties ファイル内を編集して 以下のようにする
#d_dictionary.datatype.d_text.analyzer=org.apache.luc ene.analysis.standard.StandardAnalyzer
d_dictionary.datatype.d_text.analyzer=org.apache.luce ne.analysis.cjk.CJKAnalyzer
手順どおり実行してみたが、日本語検索できず
*実は、8/21 再度試行してみたら
一部できました。その内容は、
単語によっては検索できたりできなかったり
また、コンテンツ名では検索できるが 内容 ではできないなど不安定です。
何か良い方法がありましたら
教えてください。
よろしくお願いします。
投稿情報: 菅井 富美子 | 2006年8 月21日 (月) 11:18
コメントありがとうございます。
cjkAnalyzerは単純に2文字ずつを区切ってインデックスを作成する簡易式のエンジンになります。そのため英文字との混合の単語なので相性の悪いものが存在するようです。
また、d_dictionary.datatype.d_text.analyzer以外の行も必要に応じてcjkAnalyzerに振り分けて頂く必要があるかと思います。
詳細は後ほどメールにてご返信させていただきたいと思います。
投稿情報: Ishii Akinori | 2006年8 月21日 (月) 12:19
早速のお返事ありがとうございます。
検索については、私自身がまだ、Luceneについてよく勉強していないという問題がありまして・・・
ご指示の変更をするとともにもう少し知識を増やして再度テストしてみます。
その結果は、また、後ほど投稿させていただきます。
投稿情報: 菅井 富美子 | 2006年8 月22日 (火) 08:59
お世話になります。
一年前の記事にコメントしてよいものかどうか迷いましたが質問させてください。
この記事の時点で 1.3 だったようですが、現行の 2.1 でここでの情報のどの部分がイキているでしょうか?
まず、日本語メッセージは前のバージョンのものは最初から入れていただいているようで、先ほど 2.1α版 日本語 language pack も取得して導入させていただきました。
web-client-config-custom.xml は、2.1 では
config evaluator="string-compare" condition="Languages"のlanguages要素に
language locale="ja_JP"Japanese/language
は登録した状態がデフォルトになっていますが、
search-minimum2/search-minimum
は見当たりません。
また dataTypeAnalyzers.properties は、各国語版が用意されていて dataTypeAnalyzers_ja.properties に CJKAnalyzer の登録はありますが、lucene-ja.jar は見当たりません。
インストールされている lucene は 2.1 のようですが、lucene-ja は 2.0 のドラフト版まではあったようです。
とりあえず、ここの情報にあってデフォルトインストール状態で含まれないものを足してみたのですが、Open Search の方では日本語検索が空振りしているような気がします。
一方、Alfesco ページ右上の検索エントリでは、ここでの処置をしなくても日本語がヒットしているような気がします。
投稿情報: 柴田 雅之 | 2007年7 月20日 (金) 13:14
ご回答遅れて申し訳ありません。
2.0以降のバージョンではCJKAnalyzerが同梱されています。そのためCJKAnalyzerを利用して日本語検索を行う限りにおいてはlucene-jaは必要ありません。
search-minimumはデフォルトが3になっていますので、日本語での使用についてはこの記事の内容と同じく2にしたほうが良いと思います。実はここに関してはバージョンによって細かな動作の違いがあります。デフォルト設定のままで2文字の検索を行った場合に、エラー画面が表示されるバージョンと検索ヒット0件の画面を表示するバージョンがあります。後者の場合、実際には検索エンジンまで問い合わせはいっておらず、Webクライアント上で検索手続きが中断されてしまっているようです。
投稿情報: Ishii Akinori | 2007年7 月23日 (月) 16:08
日本語フォルダ名を作ると、MyAlfrescoでファイルリストを表示したときや WebDAV親フォルダから、その日本語フォルダに降りられないという不具合があるように思います。
画面右上の検索 (Full Search?) でヒットするけど、Open Search でヒットしない日本語ファイル (MS-Word など) がありますが、Open Search の処理が日本語名フォルダに降りられないとかlucene由来でない不具合ということはないでしょうか?
投稿情報: 柴田 雅之 | 2007年7 月27日 (金) 09:19