VIT (Virtual Input) から、出力されたファイルまでの処理がすべて知りたいのでしょうか?
Windows 自身や MS-WORD の内部処理については、それぞれ公開されることはないと思いますが、IME の仕様は公開されているので、Windows から IME へ、IME からアプリケーションへの伝達については、MSDN や旧DDK あたりを参照されると情報があるのではないかと思います。
最終的な出力ファイルについては、後述の URL で詳細に書かれていますが、WORD の場合は文章中の Run 毎に内部形式を選択でき、複数の文字コードを混在させて保持することができるようになっていたと思います。また、選択されたフォントによっては日本語IMEで入力したからといって日本語として保存されるわけではなかったと思います。
保存時の形式はともかく、WORD 内部では Windows の API で扱いやすい通常の Unicode 文字列として扱っているのではないか…?と想像しますが、Office 2000/2003 あたりだと、そこそこ古いシステムですので、動作対象となる PC のスペックや OS の制約がいろいろあるので、独自の形式で保持していたかもしれませんね。
http://www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx