John Papa的一篇文章《DataSet and DataTable in ADO.NET 2.0》,详细介绍了ADO.Net 2.0的一些新功能和特性,对于利用ADO.NET开发的程序员来说,是值得关注的。现介绍如下:
一、功能增强的DataTable
在ADO.NET1.x中,DataSet完全掩盖了DataTable的光芒,并非DataTable自身功能不够强大,实则是比较DataSet而言,很多功能在1.x版本中受到了限制。例如Merge功能,在ADO.NET1.x版本中,如果要合并两个表,只有是通过DataSet的Merge方法,才能完成,代码如下:
string sqlAllCustomers = "SELECT * FROM Customers";
string cnStr = @"Data Source=.;Initial Catalog=northwind;Integrated Security=True";
using (SqlConnection cn = new SqlConnection(cnStr)) { cn.Open(); SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn); SqlDataAdapter adpt = new SqlDataAdapter(cmd); DataTable dtCust1 = new DataTable("Customers"); adpt.Fill(dtCust1); dtCust1.PrimaryKey = new DataColumn[]; DataTable dtCust2 = dtCust1.Clone(); DataRow row1 = dtCust2.NewRow(); row1["CustomerID"] = "ALFKI"; row1["CompanyName"] = "Some Company"; dtCust2.Rows.Add(row1); DataRow row2 = dtCust2.NewRow(); row2["CustomerID"] = "FOO"; row2["CompanyName"] = "Some Other Company"; dtCust2.Rows.Add(row2); DataSet ds = new DataSet("MySillyDataSet"); ds.Tables.Add(dtCust1); ds.Merge(dtCust2); dgTest.DataSource = dtCust1; }
|
在ADO.NET 2.0中,对DataTable作了改进,同样提供了Merge方法。因此如上的代码中,如果要合并表dtCust1和dtCust2,就不必再引入DataSet对象了:
此外,ADO.NET1.x版本中,DataTable也无法完成Xml文件和数据表之间的转换。这个问题在2.0版本中,也得到了改进,DataTable也具备了和DataSet对象同样的操作xml文件的能力,包括方法ReadXml,WriteXml等。
DataSet和DataTable在2.0版本中,还提供了一个新的属性RemotingFormat.在对DataTable和DataSet对象进行序列化时,该属性标示序列化的格式是二进制还是xml.
二、轻量级对象和快速遍历
ADO.NET 2.0中的DataTable提供了CreateDataReader方法(在之前的版本名为GetDataReader),该方法将创建一个DataTableReader对象。DataTableReader与DataTable不同,它是一个轻量级的对象,其支持Disconnected,这一点与DataReader(SqlDataReader)不同。这些特点决定遍历DataTableReader对象将更加快速,占用的数据资源更少(Disconnected)。下面的代码创建了一个DataTableReader对象,并将其绑定到DataGridView控件上:
using (SqlConnection cn = new SqlConnection(cnStr)) { SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn); SqlDataAdapter adpt = new SqlDataAdapter(cmd); DataTable dtCustomers = new DataTable("Customers"); adpt.Fill(dtCustomers); DataTableReader dtRdr = ds.CreateDataReader(); dgvCustomers.DataSource = dtRdr; }
|
和DataReader一样,DataTableReader对象只能向前遍历,可以通过Read方法,定位到对象的第一行。如果DataTableReader如果是被一个包含有多个数据表的DataSet对象创建,DataTableReader也会包含多个结果集。通过调用NextResult方法,访问结果集序列。
using (SqlConnection cn = new SqlConnection(cnStr)) { // Create the Command and Adapter SqlCommand cmd = new SqlCommand(sqlAllCustomers, cn); SqlDataAdapter adpt = new SqlDataAdapter(cmd); // Create a DataTable and fill it DataTable dtCustomers = new DataTable("Customers"); adpt.Fill(dtCustomers); DataSet ds = new DataSet(); ds.Tables.Add(dtCustomers); adpt.SelectCommand = new SqlCommand("SELECT * FROM Orders", cn); adpt.Fill(ds, "Orders"); // Create the DataTableReader (it is disconnected) using(DataTableReader dtRdr = ds.CreateDataReader()) { do { Console.WriteLine("******************************"); while (dtRdr.Read())
} while (dtRdr.NextResult()); } }
|
DataTableReader对象中数据表的顺序与DataSet中的数据表顺序一致。如果你需要制定特定的顺序,可以通过重载CreateDataReader方法来实现。
三、装载数据
可以通过DataTableReader对象生成DataTable和DataSet.利用DataTable和DataSet在2.0版本中新引入的方法Load,可以传递DataTableReader或者任何实现IDataReader接口的类对象。下面的代码就是通过Load方法将dt1的数据传递到新的数据表dt2中:
DataTableReader dtRdr = dt1.CreateDataReader(); DataTable dt2 = new DataTable(); dt2.Load(dtRdr);
|
在使用Load方法装载多行数据时,可以先调用BeginLoadData方法来避免通知(notifications),索引维护(index maintenance)以及约束检查(constraint checking),然后再通过EndLoadData方法返回数据。
四、性能改进
这恐怕是ADO.NET 2.0最激动人心的改进。在1.x版本中,随着数据的增大,在使用DataTable和DataSet对象时,性能是不能令人满意的。ADO.NET 2.0对索引引擎作了很大的改进,使得2.0的数据访问能力获得极大的提高。以下面的测试代码为例:
DataTable dt = new DataTable("foo"); DataColumn pkCol = new DataColumn("ID", Type.GetType("System.Int32")); pkCol.AutoIncrement = true; pkCol.AutoIncrementSeed = 1; pkCol.AutoIncrementStep = 1; dt.Columns.Add(pkCol); dt.PrimaryKey = new DataColumn[] { pkCol }; dt.Columns.Add("SomeNumber", Type.GetType("System.Int32")); dt.Columns["SomeNumber"].Unique = true; int limit = 1000000; int someNumber = limit; DateTime startTime = DateTime.Now; for (int i = 1; i <= limit; i++) { DataRow row = dt.NewRow(); row["SomeNumber"] = someNumber—; dt.Rows.Add(row); }
|
TimeSpan elapsedTime = DateTime.Now - startTime;
MessageBox.Show(dt.Rows.Count.ToString() + " rows loaded in " + elapsedTime.TotalSeconds + " seconds.");
分别在Visual Studio.NET 2003和Visual Studio 2005环境下运行,结果比较如下:
Iterations
|
ADO.NET 1.1
|
ADO.NET 2.0
|
10,000
|
0.20
|
0.20
|
100,000
|
7.91
|
3.89
|
1,000,000
|
1831.01
|
23.78
|
查看本文来源