Bài 1: Giới Thiệu SQL Server
SQL Server là một hệ thống quản lý cơ sở dữ liệu (Relational Database
Management System (RDBMS) ) sử dụng Transact-SQL để trao đổi dữ liệu
giữa Client computer và SQL Server computer. Một RDBMS bao gồm
databases, database engine và các ứng dụng dùng để quản lý dữ liệu và
các bộ phận khác nhau trong RDBMS.
Tên bài viết: SQL SERVER
Tác giả: Quang IT
Cấp độ bài viết: Chưa đánh giá
Tóm tắt:
SQL Server được tối ưu để có thể chạy trên môi trường cơ sở dữ liệu
rất lớn (Very Large Database Environment) lên đến Tera-Byte và có thể
phục vụ cùng lúc cho hàng ngàn user. SQL Server có thể kết hợp "ăn ý"
với các server khác như Microsoft Internet Information Server (IIS),
E-Commerce Server, Proxy Server....
Các SQL editions:
Enterprise : Chứa đầy đủ các đặc trưng của SQL Server và có thể chạy
tốt trên hệ thống lên đến 64 CPUs và 64 GB RAM. Thêm vào đó nó có các
dịch vụ giúp cho việc phân tích dữ liệu rất hiệu quả (Analysis Services)
Standard : Rất thích hợp cho các công ty vừa và nhỏ vì giá thành rẻ
hơn nhiều so với Enterprise Edition, nhưng lại bị giới hạn một số chức
năng cao cấp (advanced features) khác, edition này có thể chạy tốt trên
hệ thống lên đến 4 CPU và 2 GB RAM.
Developer : Có đầy đủ các tính năng của Enterprise Edition nhưng được
chế tạo đặc biệt như giới hạn số lượng người kết nối vào Server cùng
một lúc.... Ðây là edition mà các bạn muốn học SQL Server cần có. Chúng
ta sẽ dùng edition này trong suốt khóa học.
Express: Đây là phiên bản free và bị bạn chế
- 4GB database size limit
- Nếu máy có nhiều hơn 1GB RAM thì nó chỉ có thể dùng được max 1GB
- Nếu máy có nhiều CPU (logical) thì nó chỉ dùng được 1
- …
1.1. Cài Ðặt SQL Server (Installation)
Vì một trong những đặc điểm của các sản phẩm Microsoft là dễ install
nên ta không trình bày chi tiết về cách install hay các bước install mà
chỉ trình bày các điểm cần lưu ý khi install mà thôi. Khi install bạn
cần lưu ý các điểm sau:
Ở màn hình thứ hai bạn chọn Install Database Server. Sau khi install
xong SQL Server bạn có thể install thêm Analysis Service nếu bạn thích.
Ở màn hình Installation Definition bạn chọn Server and Client Tools.
Sau đó bạn nên chọn kiểu Custom và chọn tất cả các bộ phận của SQL Server. Ngoài ra nên chọn các giá trị mặc định (default)
Ở màn hình Authentication Mode nhớ chọn Mixed Mode . Lưu ý vì SQL
Server có thể dùng chung chế độ bảo mật (security) với Win NT và cũng có
thể dùng chế độ bảo mật riêng của nó. Trong Production Server người ta
thường dùng Windows Authetication vì độ an toàn cao hơn và dễ dàng cho
người quản lý mạng và cả cho người sử dụng. Nghĩa là một khi bạn được
chấp nhận (authenticated) kết nối vào domain thì bạn có quyền truy cập
dữ liệu (access data) trong SQL Server. Tuy nhiên ta nên chọn Mixed Mode
để dễ dàng cho việc học tập.
1.2. Các Version của SQL Server
SQL Server của Microsoft được thị trường chấp nhận rộng rãi kể từ
version 6.5. Sau đó Microsoft đã cải tiến và hầu như viết lại một engine
mới cho SQL Server 7.0. Cho nên có thể nói từ version 6.5 lên version
7.0 là một bước nhảy vọt. Có một số đặc tính của SQL Server 7.0 không
tương thích với version 6.5. Trong khi đó từ Version 7.0 lên version 8.0
(SQL Server 2000) thì những cải tiến chủ yếu là mở rộng các tính năng
về web và làm cho SQL Server 2000 đáng tin cậy hơn.
Một điểm đặc biệt đáng lưu ý ở version 2000 là Multiple-Instance. Nói
cho dễ hiểu là bạn có thể install version 2000 chung với các version
trước mà không cần phải uninstall chúng. Nghĩa là bạn có thể chạy song
song version 6.5 hoặc 7.0 với version 2000 trên cùng một máy (điều này
không thể xảy ra với các version trước đây). Khi đó version cũ trên máy
bạn là Default Instance còn version 2000 mới vừa install sẽ là Named
Instance.
Khi SQL Server 2005 ra đời, thì những kiến thức về SQl 2000 thực sự
không đủ để bạn làm chủ được SQL 2005. Khả năng và độ linh họat của SQL
Server 2005 được phản ánh rất rõ trong công cụ Management Studio mới và
BIDS, cụ thể như sau:
- Nâng cao bảo mật:
Bảo mật là trong tâm chính cho những tính năng mới
trong SQL Server 2005. Điều này phản ánh sự phản ứng lại của Microsoft
với sâu máy tính Slammer đã tấn công SQL Server 2000. Nó cũng cho thấy
một thế giới ngày càng có nhiều dữ liệu kinh doanh có nguy cơ bị lộ ra
ngoài Internet.
a, Bảo mật nhóm thư mục hệ thống:
- Nhóm mục hệ thống bao gồm các View bên dưới cấu
trúc dữ liệu hệ thống. Người sử dụng không thấy được bất cứ bảng bên
dưới nào, vì thế những người dùng không có kỹ năng hoặc có ý phá hoại
không thể thay đổi hoặc làm hư hỏng các bảng này được. Điều này ngăn bạn
hoặc bất kỳ ai khác làm hỏng cấu trúc chính mà SQL Server phụ thuộc
vào.
b, Bắt buộc chính sách mật khẩu:
- Khi bạn cài Window Server 2003, bạn có thể áp
dụng chính sách mật khẩu của Window (bạn đang áp dụng) cho SQL Server
2005. Bạn có thể thi hành chính sách về mức độ và ngày hết hạn của mật
khẩu trên SQL Server 2005 giống hệt như cho tài khoản đăng nhập vào
Windows mà trong 2000 không hỗ trợ tính năng này. Bạn có thể tắt hoặc mở
việc bắt buộc chính sách mật khẩu cho từng đăng nhập riêng.
c, Tách biệt giản đồ và người dùng:
- SQL Server 2000 không có khái niệm giản đồ
(Schema): Người dùng sở hữu các đối tượng CSDL. Nếu một người dùng User1
tạo một đối tượng là myTable thì tên của đối tượng sẽ là User1.myTable.
Nếu User1 bị xóa khi một nhân viên rời khỏi công ty chẳng hạn, bạn cần
thay đổi tên của đối tượng. Việc này gây ra vấn đề với những ứng dụng
phụ thuộc vào tên của đối tượng để truy xuất dữ liệu.
- Trong SQL Server 2005, người dùng có thể tạo giản
đồ có tên khác với người dùng để chứa các đối tượng CSDL. Ví dụ User1 có
thể tạo giản đồ có tên là HR và tạo một đối tượng Employee. Bạn tham
chiếu đến đối tượng đó như là HR.Employee. Vì thế nếu User1 rời khỏi
công ty, bạn không cần thay đổi tên giản đồ, nghĩa là mã ứng dụng vẫn
được giữ nguyên bởi vì đối tượng vẫn được gọi là HR.Employee.
d, Tự động tạo chứng nhận cho SSL:
- Trong SQL Server 2000, khi bạn dùng Secure Sockets
Layer (SSL) để đăng nhập vào thể hiện SQL Server, bạn phải tạo chứng
nhận để làm cơ sở sử dụng SSL. SQL Server 2005 tự tạo chứng nhận cho
bạn, điều đó cho phép bạn sử dụng SSL, mà không cần phải quan tâm việc
tạo chứng nhận.
Mở rộng T-SQL:
- Transact - SQL là một phiên bản của Structured Query
Language (SQl), được dùng bởi SQL Server 2005. Transact-SQL thường được
gọi là T-SQL. T-SQL có nhiều tính năng do Microsoft phát triển không có
trong ANSI SQL (SQL chuẩn).
- Cải tiến khả năng hỗ trợ XML: SQL Server 2000 cho phép bạn
nhận dữ liệu quan hệ ở dạng XML với mệnh đề FOR XML, hoặc lưu trữ XML
như dữ liệu quan hệ trong SQL Server sử dụng mệnh đề OPEN XML. SQL
Server 2005 có thêm một kiểu dữ liệu mới là XML cho phép bạn viết mã
nhận dữ liệu XML như là XML, tránh việc biến đổi từ XML thành dữ liệu
quan hệ khi dùng OPEN XML. Bạn cũng có thể dùng tài liệu giản đồ biểu
diễn trong ngôn ngữ W3C XML Schema Definition (đôi khi gọi là giản đồ
XSD) để chỉ ra cấu trúc hợp lệ trong XML.
- Việc sử dụng khối Try... Catch trong mã T-SQL cho phép bạn chỉ ra điều gì phải làm khi lỗi xảy ra.
- Trong SQL Server management Studio, bạn có thể tìm thấy
nhiều đoạn mã mẫu giúp bạn thực hiện những tác vụ thường gặp với T-SQL.
Để xem các mẫu này, bạn chọn trình đơn View > Template Explorer.
- Tăng cường hỗ trợ người phát triển:
a, Hỗ trợ cho Common Language Runtime (CLR):
- CLR Được dùng bơi mã .NET, được nhúng vào trong cỗ
máy CSDL SQL Server 2005. bạn có thể viết các thủ tục lưu sẵn, trigger,
hàm, tính toán tập hợp và các kiểu dữ liệu do người dùng định nghĩa bằng
cách sử dụng các ngôn ngữ như VB.NET hoặc C#.
- Thử tục lưu sẵn được viết bằng ngôn ngữ .NET là một
thay thế tốt cho thủ tục lưu sẵn mở rộng trong SQL Server 2000 bởi vì
bạn có thể chỉ ra mức độ bảo mật cho mã .NET. Có 3 mức độ bảo mật cho mã
.NET:
+ An Toàn: Mức độ này không cho phép truy cập
ngoài phạm vi SQL Server. Mã của bạn không được phép truy cập hệ thống
tập tin, registry, các biến môi trường hoặc mạng. Đây là mức bảo mật cao
nhất.
+ Truy xuất mở rộng: Mức độ này cho phép mã của
bạn truy xuất có giới hạn ra ngoài phạm vi SQL Server. Cụ thể là bạn có
thể truy xuất registry, hệ thống tập tin, các biến môi trường hoặc
mạng.
+ Không an toàn: Ở mức độ này bạn có thể truy
xuất bất kỳ chức năng mong muốn nào ngoài phạm vi SQL Server 2005. Bạn
chỉ nên dùng mức độ bảo mật này nếu chắc chắn mã được viết tốt, và bạn
tin cậy người viết mã đó.
b, Các kiểu dữ liệu mới:
- Varchar(max): Kiểu này cho phép bạn dùng chuỗi kí tự lớn hơn 8000 byte (8000 kí tự). Tối đa là 2 GB.
- Nvarchar(max): Kiểu này cho phép bạn dùng chuỗi kí tự Unicode lớn hơn 8000 byte (4000 kí tự). Tối đa là 2 GB.
- Varbinary(max): kiểu này cho phép bạn dùng dữ liệu nhị phân lớn hơn 8000 byte.
c, SQL Management Object (SMO):
- SMO thay thế cho Distributed Management Objects
(DMO) được dùng trong SQL Server 2000. SMO nhanh hơn DMO ở nhiều thiết
lập bởi vì mỗi đối tượng chỉ được thực hiện từng phần. Ví dụ, bạn muốn
liệt kê một danh sách hàng ngàn đối tượng lên tree view (Cấu trúc hình
cây), bạn không cần nạp đầy đủ thông tin của đối tượng ngay một lần. Ban
đầu bạn chỉ cần hiển thị tên của đối tượng, khi nào cần thì mới nạp đầy
đủ thông tin của đối tượng đó. Điều này giúp các bạn tiết kiệm được
nhiều thời gian cho các tác vụ đơn giản.
d, Tự động thực thi mã kịch bản:
- Nếu bạn đã dùng các chương trình của Microsoft như
Microsoft Access, Excel, bạn biết rằng có thể tạo các macro (mã thực
thi) cho phép bạn thực hiện tự động một số tác vụ nào đó. SQL Server
2005 bây giờ có tính năng tự động tạo mã kịch bản T-SQL từ những hành
động mà bạn dùng gian diện hình ảnh trong SQL Server Management Studio.
e, Truy cập Http:
- Dùng giao thức HTTP để truy cập vào SQL Server 2005
là tính năng mới cho phép người lập trình truy cập vào SQL Server mà
không phụ thuộc vào việc IIS có đang chạy trên cùng máy hay không. SQL
Server có thể cùng tồn tại với IIS nhưng không giống với SQL Server
2000, IIS không còn là yêu cầu bắt buộc với SQL Server 2005. Truy cập
HTTP cho phép phát triển dung XML Web Service với SQL Server 2005. Truy
cập HTTP có thể thực thi nhóm lệnh T-SQL hoặc thủ tục lưu sẵn. Tuy
nhiên, vì lí do bảo maajtm truy cập HTTP mặc định sẽ bị vô hiệu hóa. Để
sử dụng truy cập HTTP bạn phải chỉ rõ người dùng, thủ tục lưu sẵn và
CSDL được phép hỗ trợ nó.
- Tăng cường khả năng quản lý:
Các công cụ quản lý trong SQL Server 2005 có sự thay đổi
rất lớn với SQL Server 2000. Thay đổi chính đến từ SQL Server management
Studio.
a, Những công cụ quản lý mới:
- Trong SQL Server 2000, công cụ quản lý chủ yếu là
Enterprise Manager và Query Analyzer. SQL Server 2005, Với công cụ quản
lý mới là SQL Server Management Studio đã thay thế hoàn toàn 2 công cụ
trên của SQL 2000. Công cụ này cho phép bạn quản lý nhiều thể hiện SQL
Server dễ dàng hơn. Từ một giao diện, bạn có thể quản lý nhiều thể hiện
của cỗ mãy CSDL SQL Server, Analysis Services, Intergration Services và
Reporting Services.
- Công cụ mới SQL Server Configuration Manager cho
phép bạn kiểm soát các dịch vụ kết hợp với SQL Server 2005. Nó có thể
thay thế cho Services Manager và công cụ cấu hình mạng cho Server và
Client. Bạn cũng có thể kiểm soát một số dịch vụ khác như: SQL Server,
SQL Agent, SQL Server Analysis Services, DTS Server (Cho SQL Server
Integration Services), Full - Text Search, SQL Browser.
b, Profiler:
- Cho phép bạn phân tích những vấn đề về hiệu suất
thực thi trong SQL Server 2005. Ví dụ, Profiler mở các tập tin truy vết
mà bạn đã lưu trong hệ thống tập tin để bạn xem lại và phân tích các quá
trình SQL Server mà bạn quan tâm. Profiler có thể biểu diễn thông tin
truy vết ở dạng đồ thị để bạn có thể dễ dàng xem điều gì đã xảy ra. Nó
có thể nhận dữ liệu được ghi lại bởi Windows Performance Monitor. Bạn có
thể hiển thị dữ liệu dạng đồ thị, , xem hiệu suất thực thi trên khoảng
thời gian đã chọn. Từ đồ thị, bạn có thể truy cập đến điểm có vấn đề.
c, SQL Server Agent:
- Những khả năng của SQL Server Agent, thành phần hỗ
trợ cho các tác vụ đã được lập thời gian biểu, được nâng cao. ví dụ, số
tác vụ đồng thời mà SQL Server Agent có thể chạy được tăng lên. SQL 2000
chỉ dùng SQL Agent trong những tác vụ liên quan đến cỗ máy CSDL. còn
trong 2005, SQL Server Agent thực thi các tác vụ cho Analysis Services
và Integration Services. SQL Server Agent dùng Windows Management
Instrumentation (WMI), cho phép ạn viết mã tránh thực thi tác vụ, như
khi đĩa cứng đầy thì các tác vụ vẫn được thực thi thành công.
d, Cấu hình động:
- Trong SQL Server 2005, bạn có thể thực hiện bất kì
Thay đổi cấu hình nào mà không cần khởi động lại SQL Server, kể cả khi
bạn đang chạy trên Windows Server 2003. Bên cạnh đó, bạn cũng có thể
thay đổi áp lực CPU và I/O nếu bạn cần, có thể thêm nóng bộ nhớ cho
Server nếu bạn có phần cứng thích hợp.
e, Gửi mail từ CSDL:
- Đây là tính năng khá mới mẻ trong SQL Server 2005.
Nó thay thế SQL Mail trong SQL Server 2000. Database Mail sử dụng giao
thức Simple Mail Transfer Protocol (SMTP). Không còn bất kỳ phụ thuộc
nào với Messaging Application Programming Interface(MAPI) và cũng không
còn đòi hỏi phải có Outlook. Việc loại bỏ những phụ thuộc này tránh được
hiều vấn đề mà người dùng SQL Server 2000 gặp phải với SQL Mail. Ngoài
ra, Database Mail cũng hỗ trợ hoạt động liên tiếp, ghi tập tin Log và
kiểm tra hoạt động.
Trên đây là một số những tính năng mới trong SQL Server 2005. Phần
sau, mình sẽ tiếp tục giới thiệu tiếp những tính năng còn lại.
Bài 2: Giới Thiệu Sơ Lược Về Transact SQL (T-SQL)
Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO
(International Organization for Standardization) và ANSI (American
National Standards Institute) được sử dụng trong SQL Server khác với
P-SQL (Procedural-SQL) dùng trong Oracle.
Trong bài này chúng ta sẽ tìm hiểu sơ qua về T-SQL. Chúng được chia làm 3 nhóm:
2.1. Data Definition Language (DDL):
Ðây là những lệnh dùng để quản lý các thuộc tính của một database như
định nghĩa các hàng hoặc cột của một table, hay vị trí data file của
một database...thường có dạng
- Create object_Name
- Alter object_Name
- Drop object_Name
Trong đó object_Name có thể là một table, view, stored procedure, indexes...
Ví dụ:
Lệnh Create sau sẽ tạo ra một table tên Importers với 3 cột CompanyID,CompanyName,Contact
USE Northwind CREATE TABLE Importers( CompanyID int NOT NULL, CompanyName var char(40) NOT NULL, Contact varchar(40) NOT NULL )
Lệnh Alter sau đây cho phép ta thay đổi định nghĩa của một table như
thêm(hay bớt) một cột hay một Constraint...Trong ví dụ này ta sẽ thêm
cột ContactTitle vào table Importers
USE Northwind ALTER TABLE ImportersADD ContactTitle varchar(20) NULL
Lệnh Drop sau đây sẽ hoàn toàn xóa table khỏi database nghĩa là cả định nghĩa của table và data bên trong table đều biến mất (khác với lệnh Delete chỉ xóa data nhưng table vẫn tồn tại).
USE Northwind DROP TABLE Importers
2.2. Data Control Language (DCL):
Ðây là những lệnh quản lý các quyền truy cập lên từng object (table, view, stored procedure...). Thường có dạng sau:
- Grant
- Revoke
- Deny
Ví dụ:
Lệnh sau sẽ cho phép user trong Public Role được quyền Select đối với table Customer trong database Northwind (Role là một khái niệm giống như Windows Group sẽ được bàn kỹ trong phần Security)
USE NorthwindGRANT SELECTON CustomersTO PUBLIC
Lệnh sau sẽ từ chối quyền Select đối với table Customer trong database Northwind của các user trong Public Role
USE NorthwindDENY SELECTON CustomersTO PUBLIC
Lệnh sau sẽ xóa bỏ tác dụng của các quyền được cho phép hay từ chối trước đó
USE NorthwindREVOKE SELECTON CustomersTO PUBLIC
2.3. Manipulation Language (DML):
Ðây là những lệnh phổ biến dùng để xử lý data như Select, Update, Insert, Delete
Ví dụ:
Select
USE NorthwindSELECT CustomerID, CompanyName, ContactNameFROM CustomersWHERE (CustomerID = 'alfki' OR Cust omerID = 'anatr')ORDER BY ContactName
Insert
USE NorthwindINSERT INTO TerritoriesVALUES (98101, 'Seattle', 2)
Update
USE NorthwindUPDATE TerritoriesSET TerritoryDescription = 'Downtown Seattle'WHERE TerritoryID = 98101
Delete
USE NorthwindDELETE FROM TerritoriesWHERE TerritoryID = 98101
Vì phần này khá căn bản nên chúng tôi thiết nghĩ không cần giải thích
nhiều. Chú ý trong lệnh Delete bạn có thể có chữ From hay không đều
được.
Cú Pháp Của T-SQL:
Phần này chúng ta sẽ bàn về các thành phần tạo nên cú pháp của T-SQL
Identifiers
Ðây chính là tên của các database object. Nó dùng để xác định một
object. (Chú ý khi nói đến Object trong SQL Server là chúng ta muốn đề
cập đến table, view, stored procedure, index.....Vì hầu như mọi thứ
trong SQL Server đều được thiết kế theo kiểu hướng đối tượng
(object-oriented)). Trong ví dụ sau TableX, KeyCol, Description là những
identifiers
CREATE TABLE TableX(KeyCol INT PRIMARY KEY, Description NVARCHAR(80))
Có hai loại Identifiers một loại thông thường (Regular Identifier) và một loại gọi là Delimited Identifier,
loại này cần có dấu "" hay dấu [] để ngăn cách. Loại Delimited được
dùng đối với các chữ trùng với từ khóa của SQL Server (reserved keyword)
hay các chữ có khoảng trống.
Ví dụ:
SELECT * FROM [My Table]WHERE [Order] = 10
Trong ví dụ trên chữ Order trùng với keyword Order nên cần đặt trong dấu ngoặc vuông [].
Variables (Biến)
Biến trong T-SQL cũng có chức năng tương tự như trong các ngôn ngữ
lập trình khác nghĩa là cần khai báo trước loại dữ liệu trước khi sử
dụng. Biến được bắt đầu bằng dấu @ (Ðối với các global variable thì có
hai dấu @@)
Ví dụ:
USE NorthwindDECLARE @EmpIDVar INTSET @EmpIDVar = 3SELECT * FROM EmployeesWHERE EmployeeID = @EmpIDVar + 1
Functions (Hàm)
Có 2 loại hàm một loại là built-in và một loại user-defined
Các hàm Built-In được chia làm 3 nhóm:
- Rowset Functions : Loại này thường trả về một object và được đối xử như một table. Ví dụ như hàm OPENQUERY sẽ trả về một recordset và có thể đứng vị trí của một table trong câu lệnh Select.
- Aggregate Functions : Loại này làm việc trên một số giá trị và trả về một giá trị đơn hay là các giá trị tổng. Ví dụ như hàm AVG sẽ trả về giá trị trung bình của một cột.
- Scalar Functions : Loại này làm việc trên một giá trị đơn và trả về một giá trị đơn. Trong loại này lại chia làm nhiều loại nhỏ như các hàm về toán học, về thời gian, xử lý kiểu dữ liệu String....Ví dụ như hàm MONTH('2002-09-30') sẽ trả về tháng 9.
Các hàm User-Defined (được tạo ra bởi câu lệnh
CREATE FUNCTION và phần body thường được gói trong cặp lệnh BEGIN...END)
cũng được chia làm các nhóm như sau:
- Scalar Functions : Loại này cũng trả về một giá trị đơn bằng câu lệnh RETURNS.
- Table Functions : Loại này trả về một table
Data Type (Loại Dữ Liệu)
Các loại dữ liệu trong SQL Server sẽ được bàn kỹ sau
Expressions
Các Expressions có dạng Identifier + Operators (như +,-,*,/,=...) + Value
Các thành phần Control-Of Flow
Như BEGIN...END, BREAK, CONTINUE, GOTO, IF...ELSE, RETURN, WHILE....
Xin xem thêm Books Online để biết thêm về các thành phần này.
Comments (Chú Thích)
T-SQL dùng dấu -- để đánh dấu phần chú thích cho câu lệnh đơn và dùng /*...*/ để chú thích cho một nhóm
Thực Thi Các Câu Lệnh SQL
Thực thi một câu lệnh đơn:
Một câu lệnh SQL được phân ra thành các thành phần cú pháp như trên
bởi một parser, sau đó SQL Optimizer (một bộ phận quan trọng của SQL
Server) sẽ phân tích và tìm cách thực thi (Execute Plan) tối ưu nhất ví
dụ như cách nào nhanh và tốn ít tài nguyên của máy nhất... và sau đó SQL
Server Engine sẽ thực thi và trả về kết quả.
Thực Thi một nhóm lệnh (Batches)
Khi thực thi một nhóm lệnh SQL Server sẽ phân tích và tìm biện pháp
tối ưu cho các câu lệnh như một câu lệnh đơn và chứa execution plan đã
được biên dịch (compiled) trong bộ nhớ sau đó nếu nhóm lệnh trên được
gọi lại lần nữa thì SQL Server không cần biên dịch mà có thể thực thi
ngay điều này giúp cho một batch chạy nhanh hơn.
Lệnh GO
Lệnh này chỉ dùng để gởi một tín hiệu cho SQL Server biết đã kết thúc
một batch job và yêu cầu thực thi. Nó vốn không phải là một lệnh trong
T-SQL.
Bài 3: Data Integrity and Advanced Query Technique
Nói đến Data Integrity là ta nói đến tính toàn vẹn của một database
hay nói một cách khác là data chứa trong database phải chính xác và đáng
tin cậy. Nếu data chứa trong database không chính xác ta nói database
mất tính toàn vẹn (lost data integrity). Trong bài này chúng ta sẽ bàn
qua các phương pháp để giữ cho database được toàn vẹn.
3.1. Các Phương Pháp Ðảm Bảo Data Integrity
SQL Server dùng một số cách để đảm bảo Data Integrity. Một số cách
như Triggers hay Index sẽ được bàn đến trong các bài sau tuy nhiên trong
phạm vi bài này chúng ta cũng nói sơ qua các cách trên.
- Data Type : Data type cũng có thể đảm bảo tính toàn vẹn của data ví dụ bạn khai báo data type của một cột là Integer thì bạn không thể đưa giá trị thuộc dạng String vào được.
- Not Null Definitions : Null là một loại giá trị đặc biệt, nó không tương đương với zero, blank hay empty string " " mà có nghĩa là không biết (unknown) hay chưa được định nghĩa (undefined). Khi thiết kế database ta nên luôn cẩn thận trong việc cho phép một cột được Null hay Not Null vì việc chứa Null data có thể làm cho một số ứng dụng vốn không xửa lý null data kỹ lưỡng bị "té".
- Default Definitions : Nếu một cột được cho một giá trị default thì khi bạn không đưa vào một giá trị cụ thể nào thì SQL Server sẽ dùng giá trị mặc định này. Bạn phải dùng Default đối với Not Null definition.
- Identity Properties : Data thuộc dạng ID sẽ đảm bảo tính duy nhất của data trong table.
- Constraints : Ðây sẽ là phần mà ta đào sâu trong bài này. Constraint tạm dịch là những ràng buộc mà ta dùng để đảm bảo tính toàn vẹn của data. Constraints là những quy luật mà ta áp đặt lên một cột để đảm bảo tính chính xác của dữ liệu được nhập vào.
- Rules : Ðây là một object mang tính backward-compatible chủ yếu để tương thích với các version trước đây của SQL Server. Rules tương đương với CHECK Constraint trong SQL Server 2000 nhưng người ta có xu hướng sử dụng CHECK Constraint vì nó chính xác hơn và có thể đặt nhiều Constraints lên một cột trong khi đó chỉ có một rule cho một cột mà thôi. Chú ý rule là một object riêng và sau đó liên kết với một cột nào đó của table trong khi CHECK constraint là một thuộc tính của table nên có thể được tạo ra với lệnh CREATE TABLE.
- Triggers : Một loại stored procedure đặc biệt được thực thi một cách tự động khi một table được Update, Insert, hay Delete. Ví dụ ta muốn khi một món hàng được bán ra thì tổng số hàng hóa trong kho phải được giảm xuống (-1) chẳng hạn khi đó ta có thể dùng trigger để đảm bảo chuyện đó. Triggers sẽ được bàn kỹ trong các bài sau.
- Indexes : sẽ được bàn đến trong bài nói về Indexes.
3.2. Constraints
Constraints là những thuộc tính (property) mà ta áp đặt lên một table
hay một cột để tránh việc lưu dữ liệu không chính xác vào database
(invalid data). Thật ra NOT NULL hay DEFAULT cũng được xem là một dạng
constraint nhưng chúng ta không bao gồm hai loại này ở đây mà chỉ trình
bày 4 loại constraints là Primary Key Constraint, Unique Constraint,
Foreign Key Constraint và Check Constraint.
Primary Key Constraint:
Một table thường có một hay nhiều cột có giá trị mang tính duy nhất
để xác định một hàng bất kỳ trong table. Ta thường gọi là Primary Key và
được tạo ra khi ta Create hay Alter một table với Primary Key
Constraint.
Một table chỉ có thể có một Primary Key constraint.
Có thể có nhiều cột tham gia vào việc tạo nên một Primary Key, các cột
này không thể chứa Null và giá trị trong các cột thành viên có thể trùng
nhau nhưng giá trị của tất cả các cột tạo nên Primary Key phải mang
tính duy nhất.
Khi một Primary Key được tạo ra một Unique Index sẽ được tự động tạo
ra để duy trì tính duy nhất. Nếu trong table đó chưa có Clustered Index
thì một Unique + Clustered Index sẽ được tạo ra.
Có thể tạo ra Primary Key Constraints như sau:
CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 VARCHAR(30) )
hay
CREATE TABLE Table1 (Col1 INT, Col2 VARCHAR(30), CONSTRAINT table_pk PRIMARY KEY (Col1) )
Unique Constraint
Bạn có thể tạo Unique Constraint để đảm bảo giá trị của một cột nào
đó không bị trùng lập. Tuy Unique Constraint và Primary Key Constraint
đều đảm bảo tính duy nhất nhưng bạn nên dùng Unique Constraint trong
những trường hợp sau:
- Nếu một cột (hay một sự kết hợp giữa nhiều cột) không phải là primary key. Nên nhớ chỉ có một Primary Key Constraint trong một table trong khi ta có thể có nhiều Unique Constraint trên một table.
- Nếu một cột cho phép chứa Null. Unique constraint có thể áp đặt lên một cột chứa giá trị Null trong khi primary key constraint thì không.
Cách tạo ra Unique Constraint cũng tương tự như Primary Key
Constraint chỉ việc thay chữ Primary Key thành Unique. SQL Server sẽ tự
động tạo ra một non-clustered unique index khi ta tạo một Unique
Constraint.
Foreign Key Constraint
Foreign Key là một cột hay một sự kết hợp của nhiều cột được sử dụng
để áp đặt mối liên kết data giữa hai table. Foreign key của một table sẽ
giữ giá trị của Primary key của một table khác và chúng ta có thể tạo
ra nhiều Foreign key trong một table.
Foreign key có thể reference (tham chiếu) vào Primary Key hay cột có
Unique Constraints. Foreign key có thể chứa Null. Mặc dù mục đích chính
của Foreign Key Constraint là để kiểm soát data chứa trong table có
Foreign key (tức table con) nhưng thực chất nó cũng kiểm soát luôn cả
data trong table chứa Primary key (tức table cha). Ví dụ nếu ta delete
data trong table cha thì data trong table con trở nên "mồ côi" (orphan)
vì không thể reference ngược về table cha. Do đó Foreign Key constraint
sẽ đảm bảo điều đó không xảy ra. Nếu bạn muốn delete data trong table
cha thì trước hết bạn phải drop hay disable Foreign key trong table con
trước.
Có thể tạo ra Foreign Key Constraints như sau:
CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT REFERENCES Employees(EmployeeID) )
hay
CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT, CONSTRAINT col2_fk FOREIGN KEY (Col2) REFERENCES Employees (EmployeeID) )
Ðôi khi chúng ta cũng cần Disable Foreign Key Constraint trong trường hợp:
- Insert hay Update: Nếu data insert vào sẽ vi phạm những ràng buộc có sẵn (violate constraint) hay constraint của ta chỉ muốn áp dụng cho data hiện thời mà thôi chứ không phải data sẽ insert.
- Tiến hành quá trình replicate. Nếu không disable Foreign Key Constraint khi replicate data thì có thể cản trở quá trình copy data từ source table tới destination table một cách không cần thiết.
Check Constraint
Check Constraint dùng để giới hạn hay kiểm soát giá trị được phép
insert vào một cột. Check Constraint giống Foreign Key Constraint ở chỗ
nó kiểm soát giá trị đưa vào một cột nhưng khác ở chỗ Foreign Key
Constraint dựa trên giá trị ở table cha để cho phép một giá trị được
chấp nhận hay không trong khi Check Constraint dựa trên một biểu thức
logic (logic expression) để kiểm tra xem một giá trị có hợp lệ không. Ví
dụ ta có thể áp đặt một Check Constraint lên cột salary để chỉ chấp
nhận tiền lương từ $15000 đến $100000/năm.
Ta có thể tạo ra nhiều Check Constraint trên một cột. Ngoài ra ta có
thể tạo một Check Constraint trên nhiều cột bằng cách tạo ra Check
Constraint ở mức table (table level).
Có thể tạo ra Check Constraint như sau:
CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT CONSTRAINT limit_amount CHECK (Col2 BETWEEN 0 AND 100 0), Col3 VARCHAR(30) )
Trong ví dụ này ta giới hạn giá trị chấp nhận được của cột Col2 từ 0
đến 1000. Ví dụ sau sẽ tạo ra một Check Constraint giống như trên nhưng ở
table level:
CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT, Col3 VARCHAR(30), CONS TRAINT limit_amount CHECK (Col2 BETWEEN 0 AND 1000) )
Tương tự như Foreign Key Constraint đôi khi ta cũng cần disable Check
Constraint trong trường hợp Insert hay Update mà việc kiểm soát tính
hợp lệ của data không áp dụng cho data hiện tại. Trường hợp thứ hai là
replication.
Muốn xem hay tạo ra Constraint bằng Enterprise Manager thì làm như sau:
Click lên trên một table nào đó và chọn Design Table-> Click vào icon bên phải "Manage Constraints..."
3.3. Advanced Query Techniques
Trong phần này chúng ta sẽ đào sâu một số câu lệnh nâng cao như SELECT, INSERT...
Có thể nói hầu như ai cũng biết qua câu lệnh căn bản kiểu như "SELECT
* FROM TABLENAME WHERE..." nhưng có thể có nhiều người không biết đến
những tính chất nâng cao của nó.
Cú pháp đầy đủ của một câu lệnh SELECT rất phức tạp tuy nhiên ở đây chỉ trình bày những nét chính của lệnh này mà thôi:
SELECT select_list
[ INTO new_table ]
FROM table_source [ WHERE search_condition ]
[ GROUP BY group_by_expression ]
[ HAVING search_condition ]
[ ORDER BY order_expression [ ASC | DESC ] ]
Chúng ta sẽ lần lượt nghiên cứu từng clause (mệnh đề) trong câu lệnh này.
SELECT Clause
Sau keyword (từ khóa) SELECT ta sẽ có một danh sách các cột mà ta
muốn select được cách nhau bằng dấu ",". Có 3 Keywords cần nhấn mạnh
trong phần SELECT.
- Distinct : Khi có keyword này vào thì sẽ cho kết quả các cột không trùng nhau. Ví dụ trong Orders table của Norwind database (database mẫu di kèm với SQL Server) chứa giá trị trùng lập (duplicate value) trong cột ShipCity. Nếu ta muốn select một danh sách ShipCity trong đó mỗi city chỉ xuất hiện một lần trong kết quả nhận được ta dùng như sau:
SELECT DISTINCT ShipCity, ShipRegion FROM Orders ORDER BY Ship City
- Top n : Nếu ta muốn select n hàng đầu tiên mà thôi ta có thể dùng Top keyword. Nếu có thêm ORDER BY thì kết quả sẽ được order trước sau đó mới select. Chúng ta cũng có thể select số hàng dựa trên phần trăm bằng cách thêm Keyword Percent vào. Ví dụ sau sẽ select 10 hàng đầu tiên theo thứ tự:
SELECT DISTINCT TOP 10 ShipCity, ShipRegion FROM Orders ORDER BY ShipCity
- As : Ðôi khi chúng ta muốn cho SELECT statement dễ đọc hơn một chút ta có thể dùng một alias (tức là từ thay thế hay từ viết tắt) với keyword As hay không có keyword As: table_name As table_alias hay table_name table_alias. Ví dụ:
USE pubs SELECT p.pub_id, p.pub_name AS PubName FROM publisher s AS p
Ngoài ra trong Select list ta có thể select dưới dạng một expression như sau:
SELECT FirstName + ' ' + LastName AS "Employee Name", IDENT ITYCOL AS "Employee ID", HomePhone, Region FROM Northwind.dbo.Employees ORDER BY LastName, FirstName ASC
Trong ví dụ trên ta select cột "Employee Name" là sản phẩm ghép lại
của cột FirstName và LastName được cách nhau bằng một khoảng trắng. Một
giá trị thuộc loại identity để làm cột "Employee ID". Kết quả sẽ được
sắp theo thứ tự từ nhỏ tới lớn (ASC) (còn DESC là từ lớn tới nhỏ) trong
đó cột LastName được sắp trước rồi mới tới cột FirstName.
The INTO Clause
INTO Clause cho phép ta select data từ một hay nhiều table sau đó kết
quả sẽ được insert vào một table mới. Table này được tạo ra do kết quả
của câu lệnh SELECT INTO. Ví dụ:
SELECT FirstName, LastName INTO EmployeeNames FROM Employers
Câu lệnh tên sẽ tạo ra một table mới có tên là EmployeeNames với 2
cột là FirstName và LastName sau đó kết quả select được từ table
Employers sẽ được insert vào table mới này. Nếu table EmployeeNames tồn
tại SQL Server sẽ báo lỗi. Câu lệnh này thường hay được sử dụng để
select một lượng data lớn từ nhiều table khác nhau vào một table mới
(thường dùng cho mục đích tạm thời (temporary table)) mà khỏi phải thực
thi câu lệnh Insert nhiều lần.
Một cách khác cũng select data từ một hay nhiều table và insert vào một table khác là dùng "Insert Into...Select...". Nhưng câu lệnh này không tạo ra một table mới. Nghĩa là ta table đó phải tồn tại trước. Ví dụ:
INSERT INTO EmployeeNames SELECT FirstName, LastName FROM Empl oyers
Chú ý là không có chữ "Value" trong câu Insert này.
The GROUP BY and HAVING Clauses
GROUP BY dùng để tạo ra các giá trị tổng (aggregate values) cho từng
hàng trong kết quả select được. Chỉ có một hàng cho từng giá trị riêng
biệt (distinct) của từng cột. Các cột được select đều phải nằm trong
GROUP BY Clause. Hãy xem ví dụ phức tạp sau:
SELECT OrdD1.OrderID AS OrderID, SUM(OrdD1.Quantity) AS "Uni ts Sold", SUM(OrdD1.UnitPrice * OrdD1.Quantity) AS Revenue FR OM [Order Details] AS OrdD1 WHERE OrdD1.OrderID in (SELECT DISTINCT OrdD2.OrderID FROM [Order Details] AS OrdD2 WHERE OrdD2.UnitPrice > $100) GROUP BY OrdD1.OrderID HAVING SUM(OrdD1.Quantity) > 100
Trong ví dụ trên đầu tiên ta select những order riêng biệt (distinct)
từ Order Details table với giá > 100. Sau đó tiếp tục select
OrderID, "Units Sold", Revenue từ kết quả trên trong đó "Units Sold" và
Revenue là những aggregate columns (cho giá trị tổng một cột của những
hàng có cùng OrderID). HAVING Clause đóng vai trò như một filter dùng để
lọc lại các giá trị cần select mà thôi. HAVING Clause thường đi chung
với GROUP BY mặc dù có thể xuất hiện riêng lẻ.
UNION
Uninon keyword có nhiệm vụ ghép nối kết quả của 2 hay nhiều queries lại thành một kết quả.
Ví dụ:
Giả sử có table1(ColumnA varchar(10), ColumnB int) và table2(ColumnC
varchar(10), ColumnD int). Ta muốn select data từ table1 và ghép với
data từ table2 để tạo thành một kết quả duy nhất ta làm như sau:
SELECT * FROM Table1 UNION ALL SELECT * FROM Table2
Nếu không có keyword ALL thì những hàng giống nhau từ 2 table sẽ chỉ
xuất hiện một lần trong kết quả. Còn khi dùng ALL thì các hàng trong 2
table đều có trong kết quả bất chấp việc lập lại.
Khi Dùng Union phải chú ý hai chuyện: số cột select ở 2 queries phải
bằng nhau và data type của các cột tương ứng phải compatible (tương
thích).
3.4. Using JOINS
Trong phần này chúng ta sẽ tìm hiểu về các loại Join trong SQL
Server. Bằng cách sử dụng JOIN bạn có thể select data từ nhiều table dựa
trên mối quan hệ logic giữa các table (logical relationships). Có thể
tóm tắt các loại Join thông dụng bằng các hình sau:
Thứ tự từ trái sang phải: Inner Join, Left Outer Join, Right Outer Join, Full Outer Join
Inner Joins
Dùng Inner Join để select data từ 2 hay nhiều tables trong đó giá trị
của các cột được join phải xuất hiện ở cả 2 tables tức là phần gạch
chéo trên hình. Ví dụ:
SELECT t.Title, p.Pub_name FROM Publishers AS p INNER JOIN Titles AS t ON p.Pub_id = t.Pub_id ORDER BY Title ASC
Left Outer Joins
Dùng Left Outer Join để select data từ 2 hay nhiều tables trong đó
tất cả cột bên table thứ nhất và không tồn tại bên table thứ hai sẽ được
select cộng với các giá trị của các cột được inner join. Số cột select
được sẽ bằng với số cột của table thứ nhất. Tức là phần tô màu đỏ trên
hình. Ví dụ:
USE Pubs SELECT a.Au_fname, a.Au_lname, p.Pub_name FROM Author s a LEFT OUTER JOIN Publishers p ON a.City = p.City ORDER BY p.Pub_name ASC, a.Au_lname ASC, a.Au_fname ASC
Right Outer Joins
Dùng Right Outer Join để select data từ 2 hay nhiều tables trong đó
tất cả cột bên table thứ hai và không tồn tại bên table thứ nhất sẽ được
select cộng với các giá trị của các cột được inner join. Số cột select
được sẽ bằng với số cột của table thứ hai. Tức là phần tô màu đỏ trên
hình. Ví dụ:
USE Pubs SELECT a.Au_fname, a.Au_lname, p.Pub_name FROM Author s a RIGHT OUTER JOIN Publishers p ON a.City = p.City ORDER BY p.Pub_name ASC, a.Au_lname ASC, a.Au_fname ASC
Full Outer Joins
Dùng Full Outer Join để select data từ 2 hay nhiều tables trong đó
tất cả cột bên table thứ nhất và thứ hai đều được chọn các giá trị bên
hai table bằng nhau thì chỉ lấy một lần. Tức là phần tô màu đỏ trên
hình. Ví dụ:
USE Pubs SELECT a.Au_fname, a.Au_lname, p.Pub_name FROM Author s a FULL OUTER JOIN Publishers p ON a.City = p.City ORDER BY p.Pub_name ASC, a.Au_lname ASC, a.Au_fname ASC
Cross Joins
Dùng Cross Join ghép data từ hai table trong đó số hàng thu được bằng
với số hàng của table thứ nhất nhân với số hàng của table thứ hai. Ví
dụ:
USE pubs SELECT au_fname, au_lname, pub_name FROM authors CROS S JOIN publishers WHERE authors.city = publishers.city ORDER BY au_lname DES C
Ðể ý là trong câu lệnh này không có keyword "On".
Bài 4: Stored Procedure and Advance T-SQL
Trong bài này chúng ta sẽ tìm hiểu Stored Procedure, Cursor, Trigger và View
4.1. Cursors
Nếu giải thích một cách ngắn gọn thì cursor tương tự như recordset
hay dataset trong programming. Nghĩa là ta select một số data vào memory
sau đó có thể lần lượt làm việc với từng record bằng cách Move Next...
Có 3 loại cursors là Transact- SQL Cursors, API Cursors và Client
Cursors. Trong đó Transact-SQL và API thuộc loại Server Cursors nghĩa là
cursors được load lên và làm việc bên phía server. Trong khuôn khổ bài
học này ta chỉ nghiên cứu Transact-SQL cursors.
Transact-SQL cursors được tạo ra trên server bằng các câu lệnh
Transact-SQL và chủ yếu được dùng trong stored procedures và triggers.
Trước hết hãy xem qua một ví dụ về cursor:
DECLARE @au_lname varchar(40), @au_fname varchar(20) DECLARE Employee_Curso r CURSOR FOR SELECT LastName, FirstName FROM Northwind.dbo.Employees OPEN Employee_Cursor FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname WHILE @@FETCH_STATUS = 0 BEGIN PRINT 'Author:' + @au_fname + ' ' + @au_lname FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname END CLOSE Employee_Cursor DEALLOCATE Employee_Cursor
Trong ví dụ ở trên ta sẽ select LastName và FirstName từ Employees
table của Northwind database và load vào Employee_Cursor sau đó lần lượt
in tên của các employee ra màn hình. Ðể làm việc với một cursor ta cần
theo các bước sau:
- Dùng câu lệnh DECLARE CURSOR để khai báo một cursor. Khi khai báo ta cũng phải cho biết câu lệnh SELECTsẽ được thực hiện để lấy data.
- Dùng câu lệnh OPEN để đưa data lên memory (populate data). Ðây chính là lúc thực hiện câu lệnh SELECT vốn được khai báo ở trên.
- Dùng câu lệnh FETCH để lấy từng hàng data từ record set. Cụ thể là ta phải gọi câu lệnh FETCH nhiều lần. FETCH tương tự như lệnh Move trong ADO recordset ở chỗ nó có thể di chuyển tới lui bằng câu lệnh FETCH FIRST, FETCH NEXT, FETCH PRIOR, FETCH LAST, FETCH ABSOLUTE n, FETCH RELATIVE n nhưng khác ở chỗ là nó lấy data bỏ vào trong variable (FETCH...FROM...INTO variable_name). Thông thường ta FETCH data trước sau đó loop cho tới record cuối của Cursor bằng vòng lặp WHILE bằng cách kiểm tra global variable @@FETCH_STATUS (=0 nghĩa là thành công).
- Khi ta viếng thăm từng record ta có thể UPDATE hay DELETE tùy theo nhu cầu (trong thí dụ này chỉ dùng lệnh PRINT)
- Dùng câu lệnh CLOSE để đóng cursor. Một số tài nguyên (memory resource) sẽ được giải phóng nhưng cursor vẫn còn được khai báo và có thể OPEN trở lại.
- Dùng câu lệnh DEALLOCATE để phóng thích hoàn toàn các tài nguyên dành cho cursor (kể cả tên của cursor).
Lưu ý là trong ví dụ ở trên trước khi dùng Cursor ta cũng
declare một số variable (@au_fname và @au_lname) để chứa các giá trị lấy
được từ cursor. Bạn có thể dùng Query Analyzer để chạy thử ví dụ trên.
4.2. Stored Procedures
Trong những bài học trước đây khi dùng Query Analyzer chúng ta có thể
đặt tên và save các nhóm câu lệnh SQL vào một file dưới dạng script để
có thể sử dụng trở lại sau này. Tuy nhiên thay vì save vào text file ta
có thể save vào trong SQL Server dưới dạng Stored Procedure. Stored
Procedure là một nhóm câu lệnh Transact-SQL đã được compiled (biên
dịch) và chứa trong SQL Server dưới một tên nào đó và được xử lý như một
đơn vị (chứ không phải nhiều câu SQL riêng lẻ).
4.2.1. Ưu Ðiểm Của Stored Procedure
Stored Procedure có một số ưu điểm chính như sau:
- Performance : Khi thực thi một câu lệnh SQL thì SQL Server phải kiểm tra permission xem user gởi câu lệnh đó có được phép thực hiện câu lệnh hay không đồng thời kiểm tra cú pháp rồi mới tạo ra một execute plan và thực thi. Nếu có nhiều câu lệnh như vậy gởi qua network có thể làm giảm đi tốc độ làm việc của server. SQL Server sẽ làm việc hiệu quả hơn nếu dùng stored procedure vì người gởi chỉ gởi một câu lệnh đơn và SQL Server chỉ kiểm tra một lần sau đó tạo ra một execute plan và thực thi. Nếu stored procedure được gọi nhiều lần thì execute plan có thể được sử dụng lại nên sẽ làm việc nhanh hơn. Ngoài ra cú pháp của các câu lệnh SQL đã được SQL Sever kiểm tra trước khi save nên nó không cần kiểm lại khi thực thi.
- Programming Framework : Một khi stored procedure được tạo ra nó có thể được sử dụng lại. Ðiều này sẽ làm cho việc bảo trì (maintainability) dễ dàng hơn do việc tách rời giữa business rules (tức là những logic thể hiện bên trong stored procedure) và database. Ví dụ nếu có một sự thay đổi nào đó về mặt logic thì ta chỉ việc thay đổi code bên trong stored procedure mà thôi. Những ứng dụng dùng stored procedure này có thể sẽ không cần phải thay đổi mà vẫn tương thích với business rule mới. Cũng giống như các ngôn ngữ lập trình khác stored procedure cho phép ta đưa vào các input parameters (tham số) và trả về các output parameters đồng thời nó cũng có khả năng gọi các stored procedure khác.
- Security : Giả sử chúng ta muốn giới hạn việc truy xuất dữ liệu trực tiếp của một user nào đó vào một số tables, ta có thể viết một stored procedure để truy xuất dữ liệu và chỉ cho phép user đó được sử dụng stored procedure đã viết sẵn mà thôi chứ không thể "đụng" đến các tables đó một cách trực tiếp. Ngoài ra stored procedure có thể được encrypt (mã hóa) để tăng cường tính bảo mật.
4.2.2. Các Loại Stored Procedure
Stored procedure có thể được chia thành 5 nhóm như sau:
- System Stored Prcedure : Là những stored procedure chứa trong Master database và thường bắt đầu bằng tiếp đầu ngữ sp_ . Các stored procedure này thuộc loại built-in và chủ yếu dùng trong việc quản lý database (administration) và security. Ví dụ bạn có thể kiểm tra tất cả các processes đang được sử dụng bởi user DomainName\Administrators bạn có thể dùng sp_who @loginame='DomainName\Administrators' . Có hàng trăm system stored procedure trong SQL Server. Bạn có thể xem chi tiết trong SQL Server Books Online.
- Local Stored Procedure : Ðây là loại thường dùng nhất. Chúng được chứa trong user database và thường được viết để thực hiện một công việc nào đó. Thông thường người ta nói đến stored procedure là nói đến loại này. Local stored procedure thường được viết bởi DBA hoặc programmer. Chúng ta sẽ bàn về cách tạo stored prcedure loại này trong phần kế tiếp.
- Temporary Stored Procedure : Là những stored procedure tương tự như local stored procedure nhưng chỉ tồn tại cho đến khi connection đã tạo ra chúng bị đóng lại hoặc SQL Server shutdown. Các stored procedure này được tạo ra trên TempDB của SQL Server nên chúng sẽ bị delete khi connection tạo ra chúng bị cắt đứt hay khi SQL Server down. Temporary stored procedure được chia làm 3 loại : local (bắt đầu bằng #), global (bắt đầu bằng ##) và stored procedure được tạo ra trực tiếp trên TempDB. Loại local chỉ được sử dụng bởi connection đã tạo ra chúng và bị xóa khi disconnect, còn loại global có thể được sử dụng bởi bất kỳ connection nào. Permission cho loại global là dành cho mọi người (public) và không thể thay đổi. Loại stored procedure được tạo trực tiếp trên TempDB khác với 2 loại trên ở chỗ ta có thể set permission, chúng tồn tại kể cả sau khi connection tạo ra chúng bị cắt đứt và chỉ biến mất khi SQL Server shut down.
- Extended Stored Procedure : Ðây là một loại stored procedure sử dụng một chương trình ngoại vi (external program) vốn được compiled thành một DLL để mở rộng chức năng hoạt động của SQL Server. Loại này thường bắt đầu bằng tiếp đầu ngữ xp_ .Ví dụ, xp_sendmail dùng đề gởi mail cho một người nào đó hay xp_cmdshell dùng để chạy một DOS command... Ví dụ xp_cmdshell 'dir c:\' . Nhiều loại extend stored procedure được xem như system stored procedure và ngược lại.
- Remote Stored Procedure : Những stored procedure gọi stored procedure ở server khác.
4.2.3. Viết Stored Procedure
Tên và những thông tin về Stored Procedure khi được tạo ra sẽ chứa
trong SysObjects table còn phần text của nó chứa trong SysComments
table. Vì Stored Procedure cũng được xem như một object nên ta cũng có
thể dùng các lệnh như CREATE, ALTER, DROP để tạo mới, thay đổi hay xóa
bỏ một stored procedure. Chúng ta hãy xem một ví dụ sau về Stored
Procedure: Ðể tạo một stored procedure bạn có thể dùng Enterprise
Manager click lên trên Stored Procedure -> New Stored Procedure....
Trong ví dụ này ta sẽ tạo ra một stored procedure để insert một new
order vào Orders table trong Practice DB. Ðể insert một order vào
database ta cần đưa vào một số input như OrderID, ProductName (order món
hàng nào) và CustomerName (ai order). Sau đó ta trả về kết quả cho biết
việc insert đó có thành công hay không. Result = 0 là insert thành
công.
CREATE PROCEDURE AddNewOrder @OrderID smallint, @ProductName varchar(50), @CustomerName varchar(50), @Result smallint=1 Output AS DECLARE @CustomerID smallint BEGIN TRANSACTION If not Ex ists(SELECT CustomerID FROM Customers WHERE [Name]=@CustomerName) --This is a new customer. Insert this customer to the database BEGIN SET @CustomerID= (SELECT Max(CustomerID) FROM Customers) SET @CustomerID=@CustomerID+1 INSERT INTO Custome rs VALUES(@CustomerID,@CustomerName) If Exists(SELECT OrderI D FROM [Orders] WHERE OrderID=@OrderID) --This order exists and could not be added any more so Roll back BEGIN SELECT @Result=1 ROLLBACK TRANSACTION END Else --This is a new order insert it now BEGIN INSERT INTO [Orders](OrderID,ProductName,CustomerID) VALUES(@OrderID,@ProductName,@CustomerID) SELECT @Result=0 COMMIT TRANSACTION END END Else --T he customer exists in DB go ahead and insert the order BEGIN If Exists(SELECT OrderID FROM [Orders] WHERE OrderID=@OrderID) --This order exists and could not be added any more so Roll back BEGIN SELECT @Result=1 ROLLBACK TRANSACTION END Else --This is a n ew order insert it now BEGIN INSERT INTO [Orders](OrderID,ProductName,Custo merID) VALUES(@OrderID,@ProductName,@CustomerID) SELECT @Result=0 COMMIT TRANSACTION END END Print @Result Return
Ðể tạo ra một stored procedure ta dùng lệnh CREATE PROCEDURE theo sau
là tên của nó (nếu là temporary stored procedure thì thêm dấu # trước
tên của procedure. Nếu muốn encrypt thì dùng WITH ENCRYPTION trước chữ
AS) và các input hoặc ouput parameters. Nếu là output thì thêm keyword
OUTPUT đằng sau parameter. Ta có thể cho giá trị default cùng lúc với
khai báo data type của parameter. Kể từ sau chữ AS là phần body của
stored procedure.
Trong ví dụ ở trên trước hết ta khai báo một biến @CustomerID sau đó
bắt đầu một transaction bằng BEGIN TRANSACTION (toàn bộ công việc insert
này được thực hiện trong một Transaction nghĩa là hoặc là insert thành
công hoặc là không làm gì cả- all or nothing). Trước hết ta kiểm tra xem
người khách hàng là người mới hay cũ. Nếu là người mới thì ta "tiện
tay" insert vào Customers table luôn còn nếu không thì chỉ insert vào
Orders table mà thôi. Nếu là người customer mới ta lấy CustomerID lớn
nhất từ Customers table bỏ vào biến @CustomerID và sau đó tăng lên một
đơn vị dùng cho việc Insert Customer ở dòng kế tiếp.
Sau khi insert người customer mới ta tiếp tục công việc bằng việc
kiểm tra xem Order muốn insert có tồn tại chưa (vì nếu order đã tồn tại
thì khi insert SQL Server sẽ báo lỗi do OrderID là Primary key). Nếu như
order trên vì lý do nào đó đã có trong DB thì ta roll back và trả kết
quả =1 còn nếu không thì ta insert một order mới vào và commit
transaction với kết quả trả về =0.
Tương tự như vậy nếu người customer đã tồn tại (sau chữ else đầu
tiên) thì ta chỉ việc insert order giống như trên. Trong mọi trường hợp
kể trên ta đều in ra kết quả và return.
Ví dụ trên đây chỉ mang tính học hỏi còn trên thực tế database có thể
phức tạp hơn nhiều nên việc viết stored procedure đòi hỏi kiến thức
vững chắc về SQL và kỹ năng về programming.
4.4. Triggers
Trigger là một loại stored procedure đặc biệt được execute (thực thi)
một cách tự động khi có một data modification event xảy ra như Update,
Insert hay Delete. Trigger được dùng để đảm bảo Data Integrity hay thực
hiện các business rules nào đó.
Khi nào ta cần sử dụng Trigger:
- Ta chỉ sử dụng trigger khi mà các biện pháp bảo đảm data intergrity khác như Constraints không thể thỏa mãn yêu cầu của ứng dụng. Nên nhớ Constraint thuộc loại Declarative Data Integrity cho nên sẽ kiểm tra data trước khi cho phép nhập vào table trong khi Trigger thuộc loại Procedural Data Integrity nên việc insert, update, delete đã xảy ra rồi mới kích hoạt trigger. Chính vì vậy mà ta cần cân nhắc trước khi quyết định dùng loại nào trong việc đảm bảo Data Integrity.
-
Khi một database được denormalized (ngược lại quá trình
normalization, là một quá trình thiết kế database schema sao cho
database chứa data không thừa không thiếu) sẽ có một số data thừa
(redundant ) được chứa trong nhiều tables. Nghĩa là sẽ có một số
data được chứa cùng một lúc ở hai hay nhiều nơi khác nhau. Khi đó
để đảm bảo tính chính xác thì khi data được update ở một table này
thì cũng phải được update một cách tự động ở các table còn lại bằng
cách dùng Trigger.
Ví dụ: ta có table Item trong đó có field Barcode dùng để xác định một mặt hàng nào đó. Item table có vai trò như một cuốn catalog chứa những thông tin cần thiết mô tả từng mặt hàng. Ta có một table khác là Stock dùng để phản ánh món hàng có thực trong kho như được nhập về này nào được cung cấp bởi đại lý nào, số lượng bao nhiêu (tức là những thông tin về món hàng mà không thể chứa trong Item table được)...table này cũng có field Barcode để xác định món hàng trong kho. Như vậy thông tin về Barcode được chứa ở hai nơi khác nhau do đó ta cần dùng trigger để đảm bảo là Barcode ở hai nơi luôn được synchonize (đồng bộ). - Ðôi khi ta có nhu cầu thay đổi dây chuyền (cascade) ta có thể dùng Trigger để bảo đảm chuyện đó. Nghĩa là khi có sự thay đổi nào đó ở table này thì một số table khác cũng được thay đổi theo để đảm bảo tính chính xác. Ví dụ như khi một món hàng được bán đi thì số lượng hàng trong table Item giảm đi một món đồng thời tổng số hàng trong kho (Stock table) cũng phải giảm theo một cách tự động. Như vậy ta có thể tạo một trigger trên Item table để mỗi khi một món được bán đi thì trigger sẽ được kích hoạt và giảm tổng số hàng trong Stock table.
Ðặc điểm của Trigger:
- Một trigger có thể làm nhiều công việc (actions) khác nhau và có thể được kích hoạt bởi nhiều hơn một event. Ví dụ ta có thể viết một trigger được kích hoạt bởi bất kỳ event nào như Update, Insert hay Delete và bên trong trigger ta sẽ viết code để giải quyết cho từng trường hợp.
- Trigger không thể được tạo ra trên temporary hay system table.
- Trigger chỉ có thể được kích hoạt một cách tự động bởi một trong các event Insert, Update, Delete mà không thể chạy manually được.
- Có thể áp dụng trigger cho View.
- Khi một trigger được kích hoạt thì data mới vừa được insert hay mới vừa được thay đổi sẽ được chứa trong Inserted table còn data mới vừa được delete được chứa trong Deleted table. Ðây là 2 table tạm chỉ chứa trên memory và chỉ có giá trị bên trong trigger mà thôi (nghĩa là chỉ nhìn thấy và được query trong trigger mà thôi). Ta có thể dùng thông tin trong 2 table này để so sánh data cũ và mới hoặc kiểm tra xem data mới vừa thay đổi có hợp lệ trước khi commit hay roll back. (Xem thêm ví dụ bên dưới)
- Có 2 loại triggers (class) : INSTEAD OF và AFTER. Loại INSTEAD OF sẽ bỏ qua (bybass) action đã kích hoạt trigger mà thay vào đó sẽ thực hiện các dòng lệnh SQL bên trong Trigger. Ví dụ ta có một Update trigger trên một table với câu INSTEAD OF thì khi table được update thay vì update SQL Server sẽ thực hiện các lệnh đã được viết sẵn bên trong trigger. Ngược lại loại AFTER (loại default tương đương với keyword FOR) sẽ thực hiện các câu lệnh bên trong trigger sau khi các action tạo nên trigger đã xảy ra rồi.
Tạo Một Trigger Như Thế Nào?
Cú pháp căn bản để tạo ra một trigger có dạng như sau:
CREATE TRIGGER trigger_name
ON table_name or view_name
FOR trigger_class and trigger_type(s)
AS Transact-SQL statements
Như vậy khi tạo ra một trigger ta phải chỉ rõ là tạo ra trigger trên
table nào và được trigger khi nào (insert, update hay delete. Sau chữ AS
là các câu lệnh SQL xử lý công việc.
Ta hãy nghiên cứu một ứng dụng thực tiễn sau. Giả sử ta viết một
application cho phép user có thể Insert, Update và Delete những thông
tin nằm trong database. User này thường là những người không thông thạo
lắm về computer mà chúng tôi thường gọi đùa là "bà tám". Vào một ngày
đẹp trời, "bà tám" mặt mày tái xanh đến cầu cứu ta vì đã lỡ tay "delete"
những thông tin khá quan trọng và hy vọng ta có thể phục hồi dữ liệu
dùm. Nếu chúng ta không phòng xa trước khi viết application thì coi như
cũng vô phương cứu chữa vì data đã hoàn toàn bị delete.
Nhưng nếu bạn là một "guru" bạn sẽ gật gù "chuyện này khó lắm!" nhưng
sau đó bạn chỉ tốn vài phút đồng hồ để rollback. Muốn làm được chuyện
này chúng ta phải dùng một "chiêu" gọi là Audit (kiểm tra hay giám sát).
Tức là ngoài các table chính ta sẽ thêm các table phụ gọi là Audit
tables. Bất kỳ hoạt động nào đụng chạm vào một số table quan trọng trong
database ta đều ghi nhận vào trong Audit table. Ví dụ khi user update
hay delete một record trong table nào đó thì trước khi update hay delete
ta sẽ âm thầm di chuyển record đó sang Audit table rồi mới update hay
delete table chính. Như vậy nếu có chuyện gì xảy ra ta có thể dễ dàng
rollback (trả record về chỗ cũ).
Ví dụ:
Ta có table Orders trong PracticeDB. Ðể audit các hoạt động diễn ra
trên table này ta tạo ra một audit table với tên Aud_Orders với các
column giống y hệt với Orders table. Ngoài ra ta thêm vào 2 columns:
- Audit_Type : với các giá trị có thể là 'I','U','D' để ghi nhận record được Insert, Update hay Delete
- Date_Time_Stamp : Data Type thuộc loại DateTime dùng để ghi nhận thời điểm xảy ra sự thay đổi, có vai trò như một con dấu.
(Nếu trong môi trường nhiều user thì ta thêm một column UserID để ghi nhận user nào thay đổi).
Sau đó ta sẽ tạo ra 3 trigger dùng cho việc audit như sau:
--Insert Trigger
CREATE TRIGGER [AuditInsertOrders]
ON [dbo].[Orders]
FOR Insert
AS
insert into aud_orders select *,'I',getdate() From inserted
--Update Trigger
CREATE TRIGGER [AuditUpdateOrders]
ON [dbo].[Orders]
for UPDATE
AS
insert into aud_orders select *,'U',Getdate() from deleted
--Delete Trigger
CREATE TRIGGER [AuditDeleteOrders]
ON [dbo].[Orders]
FOR DELETE
AS
insert into aud_orders select *,'D',getdate() From deleted
Trong ví dụ trên khi user insert một record thì record mới vừa được
insert sẽ nằm trong inserted table như đã trình bày ở phần trên. Do đó
ta sẽ select tất cả các column trong inserted table cộng thêm Audit Type
"I" và dùng hàm GetDate() trong SQL Server để lấy system date time dùng
cho Date_Time_Stamp column, sau đó insert vào Aud_Orders table. Tương
tự với trường hợp Update và Delete, record đã được update hay delete nằm
trong deleted table.
Như vậy trở lại trường hợp thí dụ ở trên nếu "bà tám" yêu cầu ta có
thể vào tìm kiếm trong audit table để phục hồi lại record. Ngoài ra ta
có thể dùng table này để tìm ra thủ phạm đã xoá hay sửa chữa data khi
cần thiết.
Ðể tạo ra hay xem một trigger bằng Enterprise Manager bạn làm như
sau: Right-Click lên table mà bạn muốn tạo trigger->All Tasks->
Manage Triggers.
Lưu ý: Ðôi Khi ta chỉ muốn trigger thực sự hoạt động khi một hay vài
column nào đó được Update chứ không phải bất kỳ column nào. Khi đó ta có
thể dùng hàm Update(Column_Name) để kiểm tra xem column nào đó có bị
update hay không.
Ví dụ:
Tạo một trigger cho Customer table. Bên trong Trigger (sau chữ AS) ta
có thể kiểm tra xem nếu column First_Name hay Last_Name bị thay đổi thì
mới hành động nếu không thì không làm gì cả
IF UPDATE (first_name) OR UPDATE (Last_Name)
BEGIN
Do some conditional processing when either of these columns are updated.
END
Nếu muốn kiểm tra nhiều columns ta có thể dùng hàm khác là
Columns_Updated() . Xin xem thêm trong SQL Server Books Online để biết
thêm chi tiết về cách sử dụng.
4.4. Views
Ðịnh nghĩa một cách đơn giản thì view trong SQL Server tương tự như
Query trong Access database. View có thể được xem như một table ảo mà
data của nó được select từ một stored query. Ðối với programmer thì view
không khác chi so với table và có thể đặt ở vị trí của table trong các
câu lệnh SQL. Ðặc điểm của View là ta có thể join data từ nhiều table và
trả về một recordset đơn. Ngoài ra ta có thể "xào nấu" data (manipulate
data) trước khi trả về cho user bằng cách dùng một số logic checking
như (if, case...).
Ví dụ:
Create View OrderReport
As
Select OrderID,
(case when [Name] is null then 'New Customer'
else [Name]
end )As CustomerName,
ProductName,
DateProcessed
From Customers Right Outer Join Orders on Customers.CustomerID=Orders.CustomerID
Trong ví dụ trên ta chủ yếu trả về data từ Orders table trong
PracticeDB nhưng thay vì display CustomerID vốn không có ý nhiều ý nghĩa
đối với user ta sẽ display tên của customer bằng cách join với Customer
table. Nếu Customer Name là Null nghĩa là tên của customer đã đặt order
không tồn tại trong system. Thay vì để Null ta sẽ display "New
Customer" để dễ nhìn hơn cho user.
Nói chung câu lệnh SQL trong View có thể từ rất đơn giản như select
toàn bộ data từ một table cho đến rất phức tạp với nhiều tính năng
programming của T-SQL.
View Thường Ðược Dùng Vào Việc Gì?
View thường được sử dùng vào một số công việc sau:
- Tập trung vào một số data nhất định : ta thường dùng view
để select một số data mà user quan tâm hay chịu trách nhiệm và loại
bỏ những data không cần thiết.
Ví dụ: Giả sử trong table ta có column "Deleted" với giá trị là True hay False để đánh dấu một record bị delete hay không. Việc này đôi khi được dùng cho việc Audit. Nghĩa là trong một ứng dụng nào đó khi user delete một record nào đó, thay vì ta physically delete record ta chỉ logically delete bằng cách đánh dấu record là đã được "Deleted" để đề phòng user yêu cầu roll back. Như vậy chủ yếu ta chỉ quan tâm đến data chưa delete còn data đã được đánh dấu deleted chỉ được để ý khi nào cần roll back hay audit mà thôi. Trong trường hợp này ta có thể tạo ra một view select data mà Deleted=False và làm việc chủ yếu trên view thay vì toàn bộ table. - Ðơn giản hóa việc xử lý data: Ðôi khi ta có những query rất phức tạp và sử dụng thường xuyên ta có thể chuyển nó thành View và đối xử nó như một table, như vậy sẽ làm cho việc xử lý data dễ dàng hơn.
- Customize data: Ta có thể dùng view để làm cho users thấy data từ những góc độ khác nhau mặc dù họ đang dùng một nguồn data giống nhau. Ví dụ: Ta có thể tạo ra views trong đó những thông tin về customer được thể hiện khác nhau tùy login ID là normal user hay manager.
- Export và Import data: Ðôi khi ta muốn export data từ SQL Server sang các ứng dụng khác như Excel chẳng hạn ta có thể dùng view để join nhiều table và export dùng bcp.
Khi sử dụng view ta có thể select,insert, update, delete data bình thường như với một table.
Ví dụ:
Select * From OrderReport Where DateProcessed <'2003-01-01'
0 comments:
Post a Comment