none
SQLServer 2008 R2到SQLServer 2005的replication,Distribution Job经常执行失败。 RRS feed

  • 问题

  • 环境:SQLServer 2008 R2(发布者&分发者),SQLServer 2005(订阅者)。发布类型是:快照发布

    SQLServer 2008 R2是cluster架构,SQLAgent的启动账号是一个域账号。然而SQLServer 2005是在另外一个域中,使用的是本地的一个账号(与SQLServer 2008 R2 SQLAgent的启动账号名称与密码一致)。而且在配置复制安全性的时候,是使用SQLAgent账号的。

    第一次同步的时候是正常的,之后经常出现如下报错:

    Date  6/15/2011 6:15:00 PM
    Log  Job History (NEOFISDB-FIS_US-FIS_US_Static-FIS-ARCHIVE-3)

    Step ID  2
    Server  NEOFISDB
    Job Name  NEOFISDB-FIS_US-FIS_US_Static-FIS-ARCHIVE-3
    Step Name  Run agent.
    Duration  00:00:20
    Sql Severity  0
    Sql Message ID  0
    Operator Emailed  
    Operator Net sent  
    Operator Paged  
    Retries Attempted  0

    Message
    2011-06-15 10:15:00.889 Copyright (c) 2008 Microsoft Corporation
    2011-06-15 10:15:00.889 Microsoft SQL Server Replication Agent: distrib
    2011-06-15 10:15:00.889
    2011-06-15 10:15:00.889 The timestamps prepended to the output lines are expressed in terms of UTC time.
    2011-06-15 10:15:00.889 User-specified agent parameter values:
       -Subscriber FIS-ARCHIVE
       -SubscriberDB FIS_US_ARC
       -Publisher NEOFISDB
       -Distributor NEOFISDB
       -DistributorSecurityMode 1
       -Publication FIS_US_Static
       -PublisherDB FIS_US
       -XJOBID 0x0FD24C972D5E794C901DA8BCDB841723
       -XJOBNAME NEOFISDB-FIS_US-FIS_US_Static-FIS-ARCHIVE-3
       -XSTEPID 2
       -XSUBSYSTEM Distribution
       -XSERVER NEOFISDB
       -XCMDLINE 0
       -XCancelEventHandle 0000000000000794
       -XParentProcessHandle 0000000000000704
    2011-06-15 10:15:00.889 Startup Delay: 3785 (msecs)
    2011-06-15 10:15:04.670 Connecting to Distributor 'NEOFISDB'
    2011-06-15 10:15:04.827 Parameter values obtained from agent profile:
       -bcpbatchsize 2147473647
       -commitbatchsize 100
       -commitbatchthreshold 1000
       -historyverboselevel 1
       -keepalivemessageinterval 300
       -logintimeout 15
       -maxbcpthreads 1
       -maxdeliveredtransactions 0
       -pollinginterval 5000
       -querytimeout 1800
       -skiperrors
       -transactionsperhistory 100
    2011-06-15 10:15:04.827 Connecting to Subscriber 'FIS-ARCHIVE'
    2011-06-15 10:15:19.843 Agent message code 20084. The process could not connect to Subscriber 'FIS-ARCHIVE'.
    2011-06-15 10:15:19.936 Category:NULL
    Source:  Microsoft SQL Server Native Client 10.0
    Number:  258
    Message: TCP Provider: Timeout error [258].
    2011-06-15 10:15:19.936 Category:NULL
    Source:  Microsoft SQL Server Native Client 10.0
    Number:  258
    Message: Unable to complete login process due to delay in login response
    2011-06-15 10:15:19.936 Category:NULL
    Source:  Microsoft SQL Server Native Client 10.0
    Number:  HYT00
    Message: Login timeout expired
    2011-06-15 10:15:19.952 The agent failed with a 'Retry' status. Try to run the agent at a later time.


    If you haven't all the things you want,be grateful for the things you don't have that you didn't want.
    2011年6月16日 0:38

答案

  • 根据你的描述,是经常出问题,而不是一直都有问题

    而错误提示信息是:Unable to complete login process due to delay in login response

    从这个情况来看,有可能是你的网络,路由或者防火墙配置有问题

    之前曾经碰到过,由于IT设置的路由器配置不恰当,导致发出信息和回馈信息走不同的路(IT是这样解析的),从而导致这种错误经常出现,改了配置就好了

    建议你请IT协助你一齐检查

    2011年6月16日 6:40

全部回复

  • 在集群中,SQLAgent启动账号是本地administrators组中成员。在订阅者端是属于SQLServer2005SQLAgentUser$FIS-ARCHIVE$MSSQLSERVER和

    SQLServer2005MSSQLServerUser$FIS-ARCHIVE$MSSQLSERVER

    权限。


    If you haven't all the things you want,be grateful for the things you don't have that you didn't want.
    2011年6月16日 0:45
  • 而且我将订阅者上的SQLAgent启动账号加入到本地管理员群组中之后,第一次运行Distribution Job是成功的。

    但是后面又出现这种情况了。

    如果运行正常的话,5-10秒钟就可以执行完成,如果不正常就得运行10多分钟,一致在那retry第二步(Run Agent)。。。。


    If you haven't all the things you want,be grateful for the things you don't have that you didn't want.
    2011年6月16日 1:00
  • I told you previously that work around is not guaranteed, better to trust domains or use certificate.
    2011年6月16日 3:04
  • 根据你的描述,是经常出问题,而不是一直都有问题

    而错误提示信息是:Unable to complete login process due to delay in login response

    从这个情况来看,有可能是你的网络,路由或者防火墙配置有问题

    之前曾经碰到过,由于IT设置的路由器配置不恰当,导致发出信息和回馈信息走不同的路(IT是这样解析的),从而导致这种错误经常出现,改了配置就好了

    建议你请IT协助你一齐检查

    2011年6月16日 6:40