Bước tới nội dung

SQL

Bách khoa toàn thư mở Wikipedia
SQL
Mẫu hìnhMulti-paradigm
Thiết kế bởiDonald D. Chamberlin
Raymond F. Boyce
Nhà phát triểnISO/IEC
Xuất hiện lần đầu1974
Phiên bản ổn định
SQL:2011 / 2011
Kiểm tra kiểuStatic,strong
Hệ điều hànhCross-platform
Định dạng tập tinChi tiết định dạng tệp tin
Phần mở rộng tên file.sql
Kiểu phương tiệnapplication/sql[1][2]
Phát triển bởiISO/IEC
Phát hành lần đầu1986(1986)
Bản mới nhấtSQL:2011/ 2011;13 năm trước(2011)
Kiểu định dạngDatabase
Tiêu chuẩnISO/IEC 9075
Định dạng mở?Yes
Trang mạngwww.iso.org/standard/76583.html
Cácbản triển khailớn
Many
Phương ngữ
SQL-86, SQL-89,SQL-92,SQL:1999,SQL:2003,SQL:2006,SQL:2008,SQL:2011
Ảnh hưởng từ
Datalog
Ảnh hưởng tới
CQL,LINQ,SOQL,Windows PowerShell,[3]JPQL,jOOQ

SQL(/ˈɛskjuːˈɛl/,[4]hoặc/ˈskwəl/;[5]viết tắt củaStructured Query Language[6][7][8][9]), dịch làNgôn ngữ truy vấn mang tính cấu trúc,là một loạingôn ngữ máy tínhphổ biến để tạo, sửa, và lấydữ liệutừ mộthệ quản trị cơ sở dữ liệu quan hệ.Ngôn ngữ này phát triển vượt xa so với mục đích ban đầu là để phục vụ các hệ quản trị cơ sở dữ liệu đối tượng-quan hệ. Nó là một tiêu chuẩnANSI/ISO.

Lịch sử[sửa|sửa mã nguồn]

Từ mộtbài báo tham dự hội thảo khoa họcA Relational Model of Data for Large Share Data Banks(tạm dịch là "Mô hình quan hệ cho dữ liệu dùng trong ngân hàng dữ liệu chia sẻ có khối lượng lớn" ) của tiến sĩEdgar F. Coddxuất bảntháng 6năm1970trong tạp chíCommunications of the ACMcủaHiệp hội ACM[10],mộtmô hìnhđã được chấp nhận rộng rãi là mô hình tiêu chuẩn dùng chohệ thống quản lý cơ sở dữ liệu quan hệ[11][12].

Giữanhững năm 1970,một nhóm các nhà phát triển tại trung tâm nghiên cứu củaIBMtạiSan Josephát triển hệ thống cơ sở dữ liệu "Hệ thống R"dựa trên mô hình của Codd. Structured English Query Language, viết tắt là" SEQUEL "(tạm dịch là" Ngôn ngữ truy vấn tiếng Anh có cấu trúc "), được thiết kế để quản lý và truy lục dữ liệu được lưu trữ trongHệ thống R.Sau này, tên viết tắt SEQUEL được rút gọn thành SQL để tránh việc tranh chấp nhãn hiệu (từ SEQUEL đã được một công ty máy bay củaUKHawker-Siddeleyđăng ký). Mặc dù SQL bị ảnh hưởng bởi công trình của tiến sĩ Codd nhưng nó không do tiến sĩ Codd thiết kế ra. Ngôn ngữ SEQUEL được thiết kế bởiDonald D. ChamberlinRaymond F. Boycetại IBM, và khái niệm của họ được phổ biến để tăng sự chú ý về SQL.

Phiên bản cơ sở dữ liệu quan hệ phi thương mại, không hỗ trợ SQL đầu tiên được phát triển năm 1974.(Ingres from U.C. Berkeley.)

Năm 1978, việc thử nghiệm phương pháp được khởi đầu tại một cơ sở thử nghiệm của khách hàng. Cuộc thử nghiệm đã chứng minh được sự có ích và tính thực tiễn của hệ thống và đã chứng tỏ sự thành công của IBM. Dựa vào kết quả đó, IBM bắt đầu phát triển các sản phẩm thương mại bổ sung thêm SQL dựa trên nguyên mẫu Hệ thống R bao gồm System/38 (Hệ thống/38) (được công bố năm 1978 và được thương mại hóa tháng 8 năm 1979, SQL/DS (được giới thiệu vào năm 1981) và DB2 (năm 1983).

Cùng thời điểm đó Relational Software, Inc. (bây giờ làOracle Corporation) đã nhận thấy tiềm năng của những khái niệm được Chamberlin and Boyce đưa ra và đã phát triển phiên bảnHệ quản trị cơ sở dự liệu quan hệriêng của họ cho Navy, CIA và các tổ chức khác. Vào mùa hè năm 1979, Relational Software, Inc. giới thiệuOracleV2 (Phiên bản 2), phiên bản thương mại đầu tiên hỗ trợ SQL cho máy tínhVAX.Oracle thường xuyên được nhắc tới một cách không nghiêm túc vì đã tấn công thị trường củaIBMtrong 2 năm, nhưng việc táo bạo nhất trong quan hệ công chúng của họ là tấn công một phiên bản của IBMSystem/38chỉ trong có vài tuần. Tương lai của Oracle đã được đảm bảo vì có sự quan tâm đáng kể của công chúng sau đó mới phát triển, trong khi đã có nhiều phiên bản của các nhà cung cấp khác.

IBM đã quá chậm trong việc phát triển SQL và các sản phẩm quan hệ, có lẽ vì ban đầu nó không dùng được trong môi trường Unix và máy tính lớn (Mainframe), và họ sợ nó sẽ làm giảm lợi nhuận thu được từ việc bán các sản phẩm cơ sở dữ liệu IMS (những sản phẩm dựa trên mô hìnhcơ sở dữ liệu định hướngchứ không phải cơ sở dữ liệu quan hệ) của mình. Trong lúc đó, Oracle vẫn đang phát triển, IBM đang phát triểnSystem/38,được mong đợi là hệ cơ sở dữ liệu quan hệ đầu tiên của họ. Với năng lực và thiết kế tiên tiến của nó, người ta cho rằng nó có thể sẽ thay thế cho hệ thống Unix và máy tính lớn.

SQL được thừa nhận là tiêu chuẩn củaANSI(American National Standards Institute) vào năm 1986 vàISO(International Organization for Standardization) năm 1987. ANSI đã công bố cách phát âm chính thức của SQL là "ess kyoo ell", nhưng rất nhiều các chuyên gia cơ sở dữ liệu nói tiếng Anh vẫn gọi nó là sequel. Một quan niệm sai khác cũng được phổ biến rộng rãi đó là "SQL" là chữ viết tắt của "Structured Query Language" (Ngôn ngữ truy vấn có cấu trúc). Thực tế không phải như vậy!

Tiêu chuẩn SQL đã trải qua một số phiên bản:

Năm Tên Tên khác Chú giải
1986 SQL-86 SQL-87 Được công bố đầu tiên bởiANSI.Được phê chuẩn bởiISOnăm1987.
1989 SQL-89 Thay đổi nhỏ.
1992 SQL-92 SQL2 Thay đổi lớn.
1999 SQL:1999 SQL3
2003 SQL:2003

Các từ khóa SQL[sửa|sửa mã nguồn]

Từ khóa SQL chia thành nhiều nhóm:

Lấy dữ liệu[sửa|sửa mã nguồn]

Thao tác sử dụng nhiều nhất trong một cơ sở dữ liệu dựa trên giao dịch là thao tác lấy dữ liệu.

  • SELECTđược sử dụng để lấy dữ liệu từ một hoặc nhiều bảng trong cơ sở dữ liệu,SELECTlà lệnh thường dùng nhất củangôn ngữ sửa đổi dữ liệu(tạm dịch) (tiếng Anh:Data Manipulation Language - DML). Trong việc tạo ra câu truy vấnSELECT,người sử dụng phải đưa ra mô tả cho những dữ liệu mình muốn lấy ra chứkhôngchỉ ra những hành động vật lý nào bắt buộc phải thực hiện để lấy ra kết quả đó. Hệ thống cơ sở dữ liệu, hay chính xác hơn làbộ tối ưu hóa câu truy vấnsẽ dịch từ câu truy vấn sangkế hoạch truy vấntối ưu.
  • Những từ khóa liên quan tới SELECT bao gồm:
      • FROMdùng để chỉ định dữ liệu sẽ được lấy ra từ những bảng nào, và các bảng đóquan hệvới nhau như thế nào.
      • WHEREdùng để xác định những bản ghi nào sẽ được lấy ra, hoặc áp dụng với GROUP BY.
      • GROUP BYdùng để kết hợp các bản ghi có những giá trị liên quan với nhau thành các phần tử của một tập hợp nhỏ hơn các bản ghi.
      • HAVINGdùng để xác định những bản ghi nào, là kết quả từ từ khóa GROUP BY, sẽ được lấy ra.
      • ORDER BYdùng để xác định dữ liệu lấy ra sẽ được sắp xếp theo những cột nào.

Ví dụ sau về việc sử dụng câu lệnhSELECTđể lấy danh sách những cuốn sách có giá trị. Câu truy vấn này sẽ truy lục tất cả các bản ghi trong bảngbooksvới giá trị của cộtpricelớn hơn 100.00. Kết quả sẽ được sắp xếp theo thứ tự tăng dần của các giá trị trong cộttitle.Dấu (*) trong phầnselect listcho biết tất cả các cột của bảngbookssẽ được lấy ra và thể hiện ở kết quả.

SELECT*
FROMbooks
WHEREprice>100.00
ORDERBYtitle;

Ví dụ sau giải thích cách liên kết nhiều bảng, tập hợp các bản ghi trong câu truy vấn SQL, nó sẽ trả về danh sách các cuốn sách và số tác giả của từng cuốn sách.

SELECTbooks.title,count(*)ASAuthors
FROMbooks
JOINbook_authors
ONbooks.isbn=book_authors.isbn
GROUPBYbooks.title;

Kết quả của ví dụ trên giống như sau:

Title Authors
---------------------- -------
SQL Examples and Guide 3
The Joy of SQL 1
How to use Wikipedia 2
Pitfalls of SQL 1
How SQL Saved my Dog 1

(Ký tự gạch chân "_" thường được sử dụng trong tên bảng và tên cột để phân cách các từ vì các ký tự khác có thể mâu thuẫn với cú pháp SQL. Ví dụ như, dấu "-" có thể được hiểu là dấu trừ.)

Với điều kiện cộtisbnlà cột chung duy nhất của hai bảng và cộttitlechỉ tồn tại trong bảngbooksthì câu truy vấn trên có thể được viết lại theo mẫu sau:

SELECTtitle,count(*)ASAuthors
FROMbooks
NATURALJOINbook_authors
GROUPBYtitle;

Tuy nhiên nhiều nhà cung cấp không hỗ trợ các thức này, hoặc nó yêu cầu một số quy ước về tên cột nào đó. Như vậy, câu truy vấn trên không được phổ biến.

Sửa đổi dữ liệu[sửa|sửa mã nguồn]

Ngôn ngữ sửa đổi dữ liệu(Data Manipulation Language - DML), là một phần nhỏ của ngôn ngữ, có những thành phần tiêu chuẩn dùng để thêm, cập nhật và xóa dữ liệu delete data.

  • INSERTdùng để thêm dữ liệu vào một bảng đã tồn tại.
  • UPDATEdùng để thay đổi giá trị của một tập hợp các bản ghi trong một bảng.
  • MERGEdùng để kết hợp dữ liệu của nhiều bảng. Nó được dùng như việc kết hợp giữa hai phần tửINSERTUPDATE.
  • DELETExóa những bản ghi tồn tại trong một bảng.
  • TRUNCATEXóa toàn bộ dữ liệu trong một bảng (không phải là tiêu chuẩn, nhưng là một lệnh SQL phổ biến).

Giao dịch[sửa|sửa mã nguồn]

Giao dịch, nếu có, dùng để bao bọc các thao tác sửa đổi dữ liệu. Giao dịch (transaction) là một tập các thao tác đi cùng với nhau. Trên môi trường khách/chủ (client/server) hay môi trườngcơ sở dữ liệu phân tánviệc đảm bảo tính đúng đắn của dữ liệu rất quan trọng. Ví dụ: Một người rút tiền khỏi tài khoản tại ngân hàng, thì tại thời điểm rút tiền, thao tác rút tiền khác phải bị từ chối. Các thao tác trên tài khoản đó có thể hình dung như sau:

Thaotác1:<Mởkhóatàikhoản>
Thaotác2:<Thựchiệnthaotácrúttiền>
Thaotác3:<Khóatàikhoản>

Để đảm bảo các thao tác 1-3 phải đi liền với nhau thì phải đưa vào trong một transaction

<STARTTRANSACTION>
Thaotác1:<Mởkhóatàikhoản>
Thaotác2:<Thựchiệnthaotácrúttiền>
Thaotác3:<Khóatàikhoản>
<ENDTRANSACTION>

Các lệnh liên quan đến giao dịch:

  • BEGIN WORK(hoặcSTART TRANSACTION,tùy theo các ngôn ngữ SQL khác nhau) được sử dụng để đánh dấu việc bắt đầu mộtgiao dịch dữ liệu(giao dịch dữ liệu đó có kết thúc hoàn toàn hay không).
  • COMMITdùng để lưu lại những thay đổi trong giao dịch.
  • ROLLBACKdùng để quay lại thời điểm sử dụng lệnhCOMMITcuối cùng.

SQL Injection[sửa|sửa mã nguồn]

Là một cách chèn đoạn lệnh SQL vào để thực hiện việc vượt qua sự kiểm tra của mệnh đề WHERE. Ví dụ một câu truy vấn lấy tài khoản người dùng:

SELECTID,NAMEFROMUSERSWHEREUSERNAME='JONH'ANDPASSWORD='1234'

Câu trên chỉ có thể đúng nếu cặp USERNAME và PASSWORD tồn tại trong cơ sở dữ liệu. Câu trên có thể viết injection như sau: thay cụm từJONHthành:' OR 1=1 or''='(lưu ý ký tự nháy đơn ') khi đó câu SQL sẽ trở thành:

SELECTID,NAMEFROMUSERSWHEREUSERNAME=''OR1=1or''=''ANDPASSWORD='1234'

đoạn mã này hoạt động với bất cứ password nào. Việc phòng chống SQL Injection cũng không khó, chỉ cần chú ý khi viết là có thể chống lại được.

Định nghĩa dữ liệu[sửa|sửa mã nguồn]

Ngôn ngữ định nghĩa dữ liệu(Data Definition Language,viết tắt là DDL) là một trong những phần chính của ngôn ngữ truy vấn. Các câu lệnh này dùng để định nghĩa cấu trúc củacơ sở dữ liệu,bao gồm định nghĩa các hàng, các cột, cácbảng dữ liệu,các chỉ số và một sốthuộc tínhkhác liên quan đếncơ sở dữ liệunhư vị trí của file. Các câu lệnhngôn ngữ định nghĩa dữ liệulà thành phần chính trong cáchệ quản lý dữ liệuvà có sự khác biệt rất nhiều giữa cácngôn ngữ truy vấntrên các hệ khác nhau.

Điều khiển dữ liệu[sửa|sửa mã nguồn]

Hệ thống cơ sở dữ liệu sử dụng SQL[sửa|sửa mã nguồn]

Tham khảo[sửa|sửa mã nguồn]

  1. ^ab“Media Type registration for application/sql”.Internet Assigned Numbers Authority.ngày 10 tháng 4 năm 2013.Truy cập ngày 10 tháng 4 năm 2013.
  2. ^Lỗi chú thích: Thẻ<ref>sai; không có nội dung trong thẻ ref có tênapplication/sql
  3. ^abPaul, Ryan.“A guided tour of the Microsoft Command Shell”.Ars Technica.Truy cập ngày 10 tháng 4 năm 2011.
  4. ^abBeaulieu, Alan (tháng 4 năm 2009). Mary E Treseler (biên tập).Learning SQL(ấn bản 2). Sebastapol, CA, USA: O'Reilly.ISBN978-0-596-52083-0.
  5. ^ab“SQL, n.”.Oxford English Dictionary.Oxford University Press.Truy cập ngày 27 tháng 11 năm 2014.
  6. ^abEncyclopedia Britannica.“SQL”.Truy cập ngày 2 tháng 4 năm 2013.
  7. ^abOxford Dictionaries.“SQL”.Bản gốclưu trữ ngày 3 tháng 8 năm 2016.Truy cập ngày 25 tháng 9 năm 2015.
  8. ^abIBM.“SQL Guide”.
  9. ^abMicrosoft.“Structured Query Language (SQL)”.
  10. ^abCodd, Edgar F (tháng 6 năm 1970).“A Relational Model of Data for Large Shared Data Banks”.Communications of the ACM.Association for Computing Machinery.13(6): 377–87.doi:10.1145/362384.362685.Bản gốclưu trữ ngày 12 tháng 6 năm 2007.Truy cập ngày 9 tháng 6 năm 2007.
  11. ^abChapple, Mike.“SQL Fundamentals”.Databases.About.Bản gốclưu trữ ngày 22 tháng 2 năm 2009.Truy cập ngày 28 tháng 1 năm 2009.
  12. ^ab“Structured Query Language (SQL)”.International Business Machines. ngày 27 tháng 10 năm 2006.Truy cập ngày 10 tháng 6 năm 2007.