none
Microsoft Search サービスの予期せぬ終了 および クラスタリソース(SQL Server Fulltext)の停止について RRS feed

  • 質問

  • 表題の件でご質問させてください。

    現状、以下構成でSQL Server 2000環境がございますが、先週あたりからMicrosoft Searchサービスが停止してしまい、続けてクラスタリソースとして設定している「SQL Server Fulltext」がオフラインになってしまう事象が2週続けて発生しています。2週続けて同じような時間帯に発生しているため、週末で実施しているSQL Dumpなどが起因して発生しているかなど疑っていますが原因不明な状態です。

    <MSCS構成>
    Node1
    Node2
    共有ストレージ(クラスタリソース保存領域)

    <障害時のイベントログ(システム)>
    [1]12:21:00        Service Control Manager エラー  なし    7000    N/A     Node1     "Microsoft Search サービスは次のエラーのため開始できませんでした:
     そのサービスは指定時間内に開始要求または制御要求に応答しませんでした。 "
    [2]12:20:33        Service Control Manager エラー  なし    7009    N/A     Node1     Microsoft Search サービスへの接続中にタイムアウト (30000 ミリ秒) になり  
     ました。
    [3]12:20:32        ClusSvc エラー  フェールオーバー マネージャ     1069    N/A     Node1     リソース グループ 'TOKSQL01' のクラスタ リソース 'TOKSQL01-SQL Server 
     Fulltext' は失敗しました。
    [4]12:20:26        DCOM    エラー  なし    10005   N/A     Node1     "サーバー:
     {C731055A-AC80-11D1-8DF3-00C04FB6EF4F} を実行するために サービス mssearch (引数 """") を起動しようとしたときに、DCOM でエラー ""そのサービスは指定時間内に開 
     始要求または制御要求に応答しませんでした。 "" が発生しました。"
    [5]12:18:27        Service Control Manager エラー  なし    7034    N/A     Node1     Microsoft Search サービスは予期せず終了しました。これは 1 回発生しています。

    <障害時のイベントログ(アプリケーション)>
    [1]13:05:24        SceCli  情報    なし    1704    N/A     Node2     グループ ポリシー オブジェクト セキュリティ ポリシーは正しく適用されました。
    [2]12:16:34        Microsoft Search        エラー  Gatherer        10009   N/A     Node1     インスタンス <SQL01-SQL Server Fulltext> のリソース ステー 
     タス モニタでエラーが発生しました: 800706bf - リモート プロシージャ コールに失敗し、実行されませんでした。 
    [3]12:04:37        MSSQLSERVER     情報    -6      17055   username        SQL01        "18264 :
     バックアップしたデータベース: データベース: WWW、作成日付(時刻): 2005/03/18(17:26:19)、ダンプしたページ数: 219075、先頭 LSN: 515:7070:11、最終 LSN:  
     515:7098:1、ダンプ デバイス数: 1、デバイス情報: (FILE=1, TYPE=DISK: {'H:\DBDump\WWW\WWW_db_200909131202.BAK'})。"
    [4]12:01:04        MSSQLSERVER     情報    -2      17055   username        SQL01        "8128 :
     'xplog70.dll' バージョン '2000.80.760' を使用して、拡張ストアド プロシージャ 'xp_cmdshell' を実行します。"
    [5]10:25:20        MSSQLSERVER     情報    -2      17055   username        SQL01        "8957 :
     username  が実行した DBCC CHECKDB (wwsdb, repair_fast) は 0 個のエラーを検出し、0 個のエラーを修復しました。"


    調査にあたりイベントログ情報からいろいろとWeb上のナレッジを集めておりますが、なかなか原因特定に至らず困っております。
    情報お持ちの方または、本Search サービス、Fulltextリソース停止の原因特定方法などご教授頂ければ幸いです。

    以上、よろしくお願いいたします。

    2009年9月22日 8:28

回答

  • こんにちは、nagino です。

    クラスタは関連するサービスが多い(AD、クラスタ、SQL Server、共有 Disk、等々)ので、システムログだけでは難しいかもしれません。
    Cluster のログや SQL Server のエラーログも何か情報が無いか確認してみてください。

    周期性があり、同周期で一定の処理をおこなっているのであれば、まず関連性が疑われますね。
    原因と疑わしき処理を別タイミングで行って障害が起こるか確認することで、関連性の有無が確認できるかと。

    あと、2 週間前までは問題なかったということであれば、そのタイミングで何らかの作業を行っていないでしょうか。
    サーバー自体に対してだけでなく、AD 側でサービスアカウントの変更なども影響しますので、ちょっと範囲が広いですが・・・。
    サービスアカウントのパスワード期限切れなど、結構盲点だったりします。

    SQL DUMP というのは、バックアップのことでしょうか。
    # DUMP コマンドが BACKUP コマンドに変更となったのは 2000 か 7.0 からだったような気がしますが、2000 では DUMP コマンドでまだバックアップが取得できたはずだったかと。

    手動でオンラインにしても同様のエラーが出るようであれば、サービスアカウントや設定・レジストリ周りが怪しいと思われます。
    手動ではオンラインにできる場合は、もう少し調べないとなんとも言えないかと思います。

    フェールオーバーやフェールバック時に発生する場合は、クラスタ側などにちょっと別の原因の可能性があるかも しれません。

    MCITP(Database Developer/Database Administrator)
    • 回答としてマーク 菊地俊介 2009年10月8日 9:35
    2009年9月27日 23:27

すべての返信

  • こんにちは、nagino です。

    クラスタは関連するサービスが多い(AD、クラスタ、SQL Server、共有 Disk、等々)ので、システムログだけでは難しいかもしれません。
    Cluster のログや SQL Server のエラーログも何か情報が無いか確認してみてください。

    周期性があり、同周期で一定の処理をおこなっているのであれば、まず関連性が疑われますね。
    原因と疑わしき処理を別タイミングで行って障害が起こるか確認することで、関連性の有無が確認できるかと。

    あと、2 週間前までは問題なかったということであれば、そのタイミングで何らかの作業を行っていないでしょうか。
    サーバー自体に対してだけでなく、AD 側でサービスアカウントの変更なども影響しますので、ちょっと範囲が広いですが・・・。
    サービスアカウントのパスワード期限切れなど、結構盲点だったりします。

    SQL DUMP というのは、バックアップのことでしょうか。
    # DUMP コマンドが BACKUP コマンドに変更となったのは 2000 か 7.0 からだったような気がしますが、2000 では DUMP コマンドでまだバックアップが取得できたはずだったかと。

    手動でオンラインにしても同様のエラーが出るようであれば、サービスアカウントや設定・レジストリ周りが怪しいと思われます。
    手動ではオンラインにできる場合は、もう少し調べないとなんとも言えないかと思います。

    フェールオーバーやフェールバック時に発生する場合は、クラスタ側などにちょっと別の原因の可能性があるかも しれません。

    MCITP(Database Developer/Database Administrator)
    • 回答としてマーク 菊地俊介 2009年10月8日 9:35
    2009年9月27日 23:27
  • 皆様、こんにちは。

    naginoさん、いつも詳しい回答ありがとうございます。

    服部先生さん、フォーラムのご利用ありがとうございます。
    その後いかがでしょうか?問題の原因はわかりそうですか?
    タイムアウトが起きているようなので、サービス起動時に負荷が集中していた可能性もあるかと思います。

    また、有用な情報と思われたため、naginoさんの回答へ回答マークをつけさせていただきました。

    今後ともフォーラムをよろしくお願いします。
    それでは!
    2009年10月8日 9:38