none
ADO.NET 2.0中的DataSet和DataTable RRS feed

  • 常规讨论

  • John Papa的一篇文章《DataSet and DataTable in ADO.NET 2.0》,详细介绍了ADO.Net 2.0的一些新功能和特性,对于利用ADO.NET开发的程序员来说,是值得关注的。现介绍如下:

    一、功能增强的DataTable

    在ADO.NET1.x中,DataSet完全掩盖了DataTable的光芒,并非DataTable自身功能不够强大,实则是比较DataSet而言,很多功能在1.x版本中受到了限制。例如Merge功能,在ADO.NET1.x版本中,如果要合并两个表,只有是通过DataSet的Merge方法,才能完成,代码如下:

    string sqlAllCustomers = "SELECT * FROM Customers";

    string cnStr = @"Data Source=.;Initial Catalog=northwind;Integrated Security=True";

    using (SqlConnection cn = new SqlConnection(cnStr))
    {
    cn.Open();
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);
    DataTable dtCust1 = new DataTable("Customers");
    adpt.Fill(dtCust1);
    dtCust1.PrimaryKey = new DataColumn[];

        DataTable dtCust2 = dtCust1.Clone();
    DataRow row1 = dtCust2.NewRow();
    row1["CustomerID"] = "ALFKI";
    row1["CompanyName"] = "Some Company";
    dtCust2.Rows.Add(row1);

        DataRow row2 = dtCust2.NewRow();
    row2["CustomerID"] = "FOO";
    row2["CompanyName"] = "Some Other Company";
    dtCust2.Rows.Add(row2);

        DataSet ds = new DataSet("MySillyDataSet");
    ds.Tables.Add(dtCust1);
    ds.Merge(dtCust2);

        dgTest.DataSource = dtCust1;
    }

    在ADO.NET 2.0中,对DataTable作了改进,同样提供了Merge方法。因此如上的代码中,如果要合并表dtCust1和dtCust2,就不必再引入DataSet对象了:

    dtCust1.Merge(dtCust2);

    此外,ADO.NET1.x版本中,DataTable也无法完成Xml文件和数据表之间的转换。这个问题在2.0版本中,也得到了改进,DataTable也具备了和DataSet对象同样的操作xml文件的能力,包括方法ReadXml,WriteXml等。

    DataSet和DataTable在2.0版本中,还提供了一个新的属性RemotingFormat.在对DataTable和DataSet对象进行序列化时,该属性标示序列化的格式是二进制还是xml.

    二、轻量级对象和快速遍历

    ADO.NET 2.0中的DataTable提供了CreateDataReader方法(在之前的版本名为GetDataReader),该方法将创建一个DataTableReader对象。DataTableReader与DataTable不同,它是一个轻量级的对象,其支持Disconnected,这一点与DataReader(SqlDataReader)不同。这些特点决定遍历DataTableReader对象将更加快速,占用的数据资源更少(Disconnected)。下面的代码创建了一个DataTableReader对象,并将其绑定到DataGridView控件上:

    using (SqlConnection cn = new SqlConnection(cnStr))
    {
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);
    DataTable dtCustomers = new DataTable("Customers");
    adpt.Fill(dtCustomers);
    DataTableReader dtRdr = ds.CreateDataReader();
    dgvCustomers.DataSource = dtRdr;
    }

    和DataReader一样,DataTableReader对象只能向前遍历,可以通过Read方法,定位到对象的第一行。如果DataTableReader如果是被一个包含有多个数据表的DataSet对象创建,DataTableReader也会包含多个结果集。通过调用NextResult方法,访问结果集序列。

    using (SqlConnection cn = new SqlConnection(cnStr))
    {
    // Create the Command and Adapter
    SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn);
    SqlDataAdapter adpt = new SqlDataAdapter(cmd);

        // Create a DataTable and fill it
    DataTable dtCustomers = new DataTable("Customers");
    adpt.Fill(dtCustomers);

        DataSet ds = new DataSet();
    ds.Tables.Add(dtCustomers);
    adpt.SelectCommand = new SqlCommand("SELECT * FROM Orders", cn);
    adpt.Fill(ds, "Orders");

        // Create the DataTableReader (it is disconnected)
    using(DataTableReader dtRdr = ds.CreateDataReader())
    {
    do
    {
    Console.WriteLine("******************************");
    while (dtRdr.Read())

    }
    while (dtRdr.NextResult());
    }
    }

    DataTableReader对象中数据表的顺序与DataSet中的数据表顺序一致。如果你需要制定特定的顺序,可以通过重载CreateDataReader方法来实现。

    三、装载数据

    可以通过DataTableReader对象生成DataTable和DataSet.利用DataTable和DataSet在2.0版本中新引入的方法Load,可以传递DataTableReader或者任何实现IDataReader接口的类对象。下面的代码就是通过Load方法将dt1的数据传递到新的数据表dt2中:

    DataTableReader dtRdr = dt1.CreateDataReader();
     DataTable dt2 = new DataTable();
     dt2.Load(dtRdr);

    在使用Load方法装载多行数据时,可以先调用BeginLoadData方法来避免通知(notifications),索引维护(index maintenance)以及约束检查(constraint checking),然后再通过EndLoadData方法返回数据。

    四、性能改进

    这恐怕是ADO.NET 2.0最激动人心的改进。在1.x版本中,随着数据的增大,在使用DataTable和DataSet对象时,性能是不能令人满意的。ADO.NET 2.0对索引引擎作了很大的改进,使得2.0的数据访问能力获得极大的提高。以下面的测试代码为例:

    DataTable dt = new DataTable("foo");
    DataColumn pkCol = new DataColumn("ID", Type.GetType("System.Int32"));
    pkCol.AutoIncrement = true;
    pkCol.AutoIncrementSeed = 1;
    pkCol.AutoIncrementStep = 1;
    dt.Columns.Add(pkCol);
    dt.PrimaryKey = new DataColumn[] { pkCol };
    dt.Columns.Add("SomeNumber", Type.GetType("System.Int32"));
    dt.Columns["SomeNumber"].Unique = true;

    int limit = 1000000;
    int someNumber = limit;
    DateTime startTime = DateTime.Now;
    for (int i = 1; i <= limit; i++)
    {
    DataRow row = dt.NewRow();
    row["SomeNumber"] = someNumber—;
    dt.Rows.Add(row);
    }

    TimeSpan elapsedTime = DateTime.Now - startTime;

    MessageBox.Show(dt.Rows.Count.ToString() + " rows loaded in " + elapsedTime.TotalSeconds + " seconds.");

    分别在Visual Studio.NET 2003和Visual Studio 2005环境下运行,结果比较如下:

    Iterations

    ADO.NET 1.1

    ADO.NET 2.0

    10,000

    0.20

    0.20

    100,000

    7.91

    3.89

    1,000,000

    1831.01

    23.78

    查看本文来源

    2009年5月27日 7:45