none
Windowsにおける日本語処理について(IME) RRS feed

  • 質問

  • Office Word にIMEで日本語を入力した場合、Windows内で行われる処理内容と、結果的に出力される文字コード(シフトJiS?)を教えていただきたいです。

    ※環境は以下の内容となります。
     OS    :Windows 7
      IME   :Microsoft IME Standard 2003
      Office:Microsoft Office 2003

    2010年9月28日 7:15

すべての返信

  • VIT (Virtual Input) から、出力されたファイルまでの処理がすべて知りたいのでしょうか?

    Windows 自身や MS-WORD の内部処理については、それぞれ公開されることはないと思いますが、IME の仕様は公開されているので、Windows から IME へ、IME からアプリケーションへの伝達については、MSDN や旧DDK あたりを参照されると情報があるのではないかと思います。

    最終的な出力ファイルについては、後述の URL で詳細に書かれていますが、WORD の場合は文章中の Run 毎に内部形式を選択でき、複数の文字コードを混在させて保持することができるようになっていたと思います。また、選択されたフォントによっては日本語IMEで入力したからといって日本語として保存されるわけではなかったと思います。

    保存時の形式はともかく、WORD 内部では Windows の API で扱いやすい通常の Unicode 文字列として扱っているのではないか…?と想像しますが、Office 2000/2003 あたりだと、そこそこ古いシステムですので、動作対象となる PC のスペックや OS の制約がいろいろあるので、独自の形式で保持していたかもしれませんね。

    http://www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx

    2010年9月28日 8:42
  • 御回答をいただき、ありがとうございました。

    内部処理を知ることはとても難しいということですね。

    VITについてですが、そもそもVITというものを知らなかったため、特に意識していなかったです。

    ちなみに出力された文字コード(シフトJISなど)が何であるかを分かる方法はありますでしょうか。

    2010年9月29日 0:18