Bài tập tin học về bảo mật mật mã

  • 1. THÔNG TIN Hà nội 8-2013
  • 2. môn học “An toàn và bảo mật thông tin” đã được đưa vào giảng dạy tại hầu hết các Khoa Công nghệ Thông tin của các trường đại học và cao đẳng. Do các ứng dụng trên mạng Internet ngày các phát triển và mở rộng, nên an toàn thông tin trên mạng đã trở thành nhu cầu bắt buộc cho mọi hệ thống ứng dụng. Để đáp ứng yêu cầu học tập và tự tìm hiểu của sinh viên các chuyên ngành Công nghệ Thông tin, nhóm giảng viên phụ trách môn Bảo mật của khoa Công nghệ thông tin, trường ĐH Kinh doanh và Công nghệ Hà Nội đã tổ chức biên soạn giáo trình này. Nội dung của nó được dựa trên một số tài liệu, nhưng chủ yếu là cuốn sách của Giáo sư William Stallings “Cryptography and Network Security: Principles and Practice”. Bản dịch chúng tôi tham khảo bài giảng của TS. Trần Văn Dũng – khoa CNTT, ĐH Giao Thông vận tải Hà Nội. Cuốn sách trên đã được dùng làm tài liệu giảng dạy tại nhiều trường đại học. Với mục đích trang bị các kiến thức cơ sở vừa đủ và giúp cho sinh viên hiểu được bản chất của các khía cạnh an ninh trên mạng, trong giáo trình đã cố gắng trình bày tóm tắt các phần lý thuyết cơ bản và đưa ra các ứng dụng thực tế. Giáo trình gồm 7 chương. Chương đầu nêu tổng quan về bảo mật, chương 2 tóm tắt sơ lược về mã cổ điển, chương 3 trình bày những khái niệm cơ bản về số học, chương 4 giới thiệu về Mã khối và chuẩn mã dữ liệu, chương 5 nêu về mã công khai và RSA, chương 6 giới thiệu Ứng dụng về an toàn Web và IP và cuối cùng chương 7 tóm tắt về Kẻ xâm nhập và biện pháp phòng chống bức tường lửa . 2
  • 3. TỔNG QUAN VỀ BẢO MẬT........................................................................4 1.1 Gi i thi u chung v b o m t thông tin ớ ệ ề ả ậ ........................................................4 1.2 D ch v , c ch , t n công. ị ụ ơ ế ấ ............................................................................6 1.3 Mô hình an to n m ng à ạ ................................................................................7 1.4 B o m t thông tin trong h c s d li u ả ậ ệ ơ ở ữ ệ ....................................................9 Câu h i v b i t p ỏ à à ậ ............................................................................................12 CHƯƠNG 2. MÃ CỔ ĐIỂN................................................................................................13 2.1 Mã i x ng. đố ứ ...............................................................................................13 2.2 Các mã th c i n thay th ế ổđể ế.......................................................................16 2.3 Các mã th c i n hoán v ế ổđể ị........................................................................22 2.4 M t s v n khác. ộ ố ấ đề ...................................................................................23 CHƯƠNG 3. CƠ SỞ TOÁN HỌC......................................................................................27 3.1 S h c trên Modulo ố ọ ....................................................................................27 3.2. M t s thu t toán trên Zn ộ ố ậ .........................................................................30 3.3 Gi i thi u lý thuy t s ớ ệ ế ố................................................................................33 Câu h i v b i t p. ỏ à à ậ ...........................................................................................37 CHƯƠNG 4. CHUẨN MÃ DỮ LIỆU (DES) VÀ CHUẨN MÃ NÂNG CAO (AES).......39 4.1 Chu n mã d li u (DES) ẩ ữ ệ ............................................................................39 4.3. Double DES v Triple DES à .......................................................................47 4.4 Chu n mã nâng cao (AES) ẩ .........................................................................48 Câu h i v b i t p ỏ à à ậ ............................................................................................50 CHƯƠNG 5. MÃ CÔNG KHAI VÀ QUẢN LÝ KHOÁ....................................................51 5.1 Mã khoá công khai.....................................................................................51 5.2 H m t mã RSA ệ ậ .........................................................................................53 5.3 Qu n lý khoá ả ..............................................................................................57 5.4 Trao i khoá Diffie Hellman đổ ....................................................................59 Câu h i v b i t p ỏ à à ậ ............................................................................................61 CHƯƠNG 6. AN TOÀN IP VÀ WEB................................................................................62 6.1 An to n IP à ...................................................................................................62 6.2 An to n Web à ...............................................................................................64 6.3 Thanh toán i n t an to n đ ệ ử à ........................................................................68 6.4 An to n th i n t à ư đ ệ ử.....................................................................................71 Câu h i v b i t p ỏ à à ậ ............................................................................................75 CHƯƠNG 7. KẺ XÂM NHẬP, PHẦN MỀM CÓ HẠI VÀ BỨC TƯỜNG LỬA.............76 7.1 K xâm nh p ẻ ậ ..............................................................................................76 7.2 Ph n m m có h i ầ ề ạ ........................................................................................79 7.3 Tr n b m à ộ đệ ...............................................................................................84 7.4 B c t ng l a ứ ườ ử ..............................................................................................91 Câu h i v b i t p ỏ à à ậ ............................................................................................96 DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT.......................................................97 DANH SÁCH CÁC ĐỀ TÀI THẢO LUẬN.....................................................................100 TÀI LIỆU THAM KHẢO..................................................................................................101 3
  • 4. QUAN VỀ BẢO MẬT 1.1 Giới thiệu chung về bảo mật thông tin 1.1.1 Mở đầu về bảo mật thông tin Ngày nay với sự phát triển bùng nổ của công nghệ thông tin, hầu hết các thông tin của doanh nghiệp như chiến lược kinh doanh, các thông tin về khách hàng, nhà cung cấp, tài chính, mức lương nhân viên,…đều được lưu trữ trên hệ thống máy tính. Cùng với sự phát triển của doanh nghiệp là những đòi hỏi ngày càng cao của môi trường kinh doanh yêu cầu doanh nghiệp cần phải chia sẻ thông tin của mình cho nhiều đối tượng khác nhau qua Internet hay Intranet. Việc mất mát, rò rỉ thông tin có thể ảnh hưởng nghiêm trọng đến tài chính, danh tiếng của công ty và quan hệ với khách hàng. Các phương thức tấn công thông qua mạng ngày càng tinh vi, phức tạp có thể dẫn đến mất mát thông tin, thậm chí có thể làm sụp đổ hoàn toàn hệ thống thông tin của doanh nghiệp. Vì vậy an toàn và bảo mật thông tin là nhiệm vụ rất nặng nề và khó đoán trước được, nhưng tựu trung lại gồm ba hướng chính sau: - Bảo đảm an toàn thông tin tại máy chủ - Bảo đảm an toàn cho phía máy trạm - Bảo mật thông tin trên đường truyền Đứng trước yêu cầu bảo mật thông tin, ngoài việc xây dựng các phương thức bảo mật thông tin thì người ta đã đưa ra các nguyên tắc về bảo vệ dữ liệu như sau: - Nguyên tắc hợp pháp trong lúc thu thập và xử lý dữ liệu. - Nguyên tắc đúng đắn. - Nguyên tắc phù hợp với mục đích. - Nguyên tắc cân xứng. - Nguyên tắc minh bạch. - Nguyên tắc được cùng quyết định cho từng cá nhân và bảo đảm quyền truy cập cho người có liên quan. - Nguyên tắc không phân biệt đối xử. - Nguyên tắc an toàn. - Nguyên tắc có trách niệm trước pháp luật. - Nguyên tắc giám sát độc lập và hình phạt theo pháp luật. - Nguyên tắc mức bảo vệ tương ứng trong vận chuyển dữ liệu xuyên biên giới. Ở đây chúng ta sẽ tập trung xem xét các nhu cầu an ninh và đề ra các biện pháp an toàn cũng như vận hành các cơ chế để đạt được các mục tiêu đó. Nhu cầu an toàn thông tin: • An toàn thông tin đã thay đổi rất nhiều trong thời gian gần đây. Trước kia hầu như chỉ có nhu cầu bảo mật thông tin, nay đòi hỏi thêm nhiều yêu cầu mới như an ninh máy chủ và trên mạng. • Các phương pháp truyền thống được cung cấp bởi các cơ chế hành chính và phương tiện vật lý như nơi lưu trữ bảo vệ các tài liệu quan trọng và cung cấp giấy phép được quyền sử dụng các tài liệu mật đó. • Máy tính đòi hỏi các phương pháp tự động để bảo vệ các tệp và các thông tin lưu trữ. Nhu cầu bảo mật rất lớn và rất đa dạng, có mặt khắp mọi nơi, mọi lúc. Do đó không thể không đề ra các qui trình tự động hỗ trợ bảo đảm an toàn thông tin. • Việc sử dụng mạng và truyền thông đòi hỏi phải có các phương tiện bảo vệ dữ liệu khi truyền. Trong đó có cả các phương tiện phần mềm và phần cứng, đòi hỏi có những nghiên cứu mới đáp ứng các bài toán thực tiễn đặt ra. 4
  • 5. An toàn máy tính: tập hợp các công cụ được thiết kế để bảo vệ dữ liệu và chống hacker. • An toàn mạng: các phương tiện bảo vệ dữ liệu khi truyền chúng. • An toàn Internet: các phương tiện bảo vệ dữ liệu khi truyền chúng trên tập các mạng liên kết với nhau. Mục đích của môn học là tập trung vào an toàn Internet gồm các phương tiện để bảo vệ, chống, phát hiện, và hiệu chỉnh các phá hoại an toàn khi truyền và lưu trữ thông tin. 1.1.2 Nguy cơ và hiểm họa đối với hệ thống thông tin Các hiểm họa đối với hệ thống có thể được phân loại thành hiểm họa vô tình hay cố ý, chủ động hay thụ động. - Hiểm họa vô tình: khi người dùng khởi động lại hệ thống ở chế độ đặc quyền, họ có thể tùy ý chỉnh sửa hệ thống. Nhưng sau khi hoàn thành công việc họ không chuyển hệ thống sang chế độ thông thường, vô tình để kẻ xấu lợi dụng. - Hiểm họa cố ý: như cố tình truy nhập hệ thống trái phép. - Hiểm họa thụ động: là hiểm họa nhưng chưa hoặc không tác động trực tiếp lên hệ thống, như nghe trộm các gói tin trên đường truyền. - Hiểm họa chủ động: là việc sửa đổi thông tin, thay đổi tình trạng hoặc hoạt động của hệ thống. Đối với mỗi hệ thống thông tin mối đe dọa và hậu quả tiềm ẩn là rất lớn, nó có thể xuất phát từ những nguyên nhân như sau: - Từ phía người sử dụng: xâm nhập bất hợp pháp, ăn cắp tài sản có giá trị - Trong kiến trúc hệ thống thông tin: tổ chức hệ thống kỹ thuật không có cấu trúc hoặc không đủ mạnh để bảo vệ thông tin. - Ngay trong chính sách bảo mật an toàn thông tin: không chấp hành các chuẩn an toàn, không xác định rõ các quyền trong vận hành hệ thống. - Thông tin trong hệ thống máy tính cũng sẽ dễ bị xâm nhập nếu không có công cụ quản lý, kiểm tra và điều khiển hệ thống. - Nguy cơ nằm ngay trong cấu trúc phần cứng của các thiết bị tin học và trong phần mềm hệ thống và ứng dụng do hãng sản xuất cài sẵn các loại 'rệp' điện tử theo ý đồ định trước, gọi là 'bom điện tử'. - Nguy hiểm nhất đối với mạng máy tính mở là tin tặc, từ phía bọn tội phạm. 5
  • 6. tấn công phá hoại an toàn: Các hệ thống trên mạng có thể là đối tượng của nhiều kiểu tấn công: - Tấn công giả mạo là một thực thể tấn công giả danh một thực thể khác. Tấn công giả mạo thường được kết hợp với các dạng tấn công khác như tấn công chuyển tiếp và tấn công sửa đổi thông báo. - Tấn công chuyển tiếp xảy ra khi một thông báo, hoặc một phần thông báo được gửi nhiều lần, gây ra các tác động tiêu cực. - Tấn công sửa đổi thông báo xảy ra khi nội dung của một thông báo bị sửa đổi nhưng không bị phát hiện. - Tấn công từ chối dịch vụ xảy ra khi một thực thể không thực hiện chức năng của mình, gây cản trở cho các thực thể khác thực hiện chức năng của chúng. - Tấn công từ bên trong hệ thống xảy ra khi người dùng hợp pháp cố tình hoặc vô ý can thiệp hệ thống trái phép. Còn tấn công từ bên ngoài là nghe trộm, thu chặn, giả mạo người dùng hợp pháp và vượt quyền hoặc lách qua các cơ chế kiểm soát truy nhập. • Tấn công bị động. Do thám, theo dõi đường truyền để: o nhận được nội dung bản tin hoặc o theo dõi luồng truyền tin • Tấn công chủ động. Thay đổi luồng dữ liệu để: o giả mạo một người nào đó. o lặp lại bản tin trước o thay đổi ban tin khi truyền o từ chối dịch vụ. 1.2 Dịch vụ, cơ chế, tấn công. Nhu cầu thực tiến dẫn đến sự cần thiết có một phương pháp hệ thống xác định các yêu cầu an ninh của tổ chức. Trong đó cần có tiếp cận tổng thể xét cả ba khía cạnh của an toàn thông tin: bảo vệ tấn công, cơ chế an toàn và dịch vụ an toàn. Sau đây chúng ta xét chúng theo trình tự ngược lại: 1.2.1 Các dịch vụ an toàn. 6
  • 7. cụ đảm bảo an toàn của hệ thống xử lý thông tin và truyền thông tin trong tổ chức. Chúng được thiết lập để chống lại các tấn công phá hoạ1. Có thể dùng một hay nhiều cơ chế an toàn để cung cấp dịch vụ. Thông thường người ta cần phải tạo ra các liên kết với các tài liệu vật lý: như có chữ ký, ngày tháng, bảo vệ cần thiết chống khám phá, sửa bậy, phá hoại, được công chứng, chứng kiến, được ghi nhận hoặc có bản quyền. 1.2.2 Các cơ chế an toàn: Từ các công việc thực tế để chống lại các phá hoại an ninh, người ta đã hệ thống và sắp xếp lại tạo thành các cơ chế an ninh khác nhau. Đây là cơ chế được thiết kế để phát hiện, bảo vệ hoặc khôi phục do tấn công phá hoại. Không có cơ chế đơn lẻ nào đáp ứng được mọi chức năng yêu cầu của công tác an ninh. Tuy nhiên có một thành phần đặc biệt nằm trong mọi cơ chế an toàn đó là: kỹ thuật mã hoá. Do đó chúng ta sẽ dành một thời lượng nhất định tập trung vào lý thuyết mã. 1.2.3 Tấn công phá hoại an ninh: Ta xác định rõ thế nào là các hành động tấn công phá họai an ninh. Đó là mọi hành động chống lại sự an toàn thông tin của các tổ chức. An toàn thông tin là bàn về bằng cách nào chống lại tấn công vào hệ thống thông tin hoặc phát hiện ra chúng. Trên thực tế có rất nhiều cách và nhiều kiểu tấn công khác nhau. Thường thuật ngữ đe doạ và tấn công được dùng như nhau. Cần tập trung chống một số kiểu tấn công chính: thụ động và chủ động. 1.3 Mô hình an toàn mạng 1.3.1 Kiến trúc an toàn của hệ thống truyền thông mở OSI. Để giúp cho việc hoạch định chính sách và xây dựng hệ thống an ninh tốt. Bộ phận chuẩn hóa tiêu chuẩn của tổ chức truyền thông quốc tế (International Telecommunication Union) đã nghiên cứu và đề ra Kiến trúc an ninh X800 dành cho hệ thống trao đổi thông tin mở OSI. Trong đó định nghĩa một cách hệ thống phương pháp xác định và cung cấp các yêu cầu an toàn.Nó cung cấp cho chúng ta một cách nhìn tổng quát, hữu ích về các khái niệm mà chúng ta nghiên cứu. 7
  • 8. về dich vụ an toàn, X800 định nghĩa đây là dịch vụ cung cấp cho tầng giao thức của các hệ thống mở trao đổi thông tin, mà đảm bảo an toàn thông tin cần thiết cho hệ thống và cho việc truyền dữ liệu. Trong tài liệu các thuật ngữ chuẩn trên Internet RFC 2828 đã nêu định nghĩa cụ thể hơn dich vụ an toàn là dịch vụ trao đổi và xử lý cung cấp cho hệ thống việc bảo vệ đặc biệt cho các thông tin nguồn.Tài liệu X800 đưa ra định nghĩa dịch vụ theo 5 loại chính: - Xác thực: tin tưởng là thực thể trao đổi đúng là cái đã tuyên bố. Người đang trao đổi xưng tên với mình đúng là anh ta, không cho phép người khác mạo danh. - Quyền truy cập: ngăn cấm việc sử dụng nguồn thông tin không đúng vai trò. Mỗi đối tượng trong hệ thống được cung cấp các quyền hạn nhất định và chỉ được hành động trong khuôn khổ các quyền hạn đó. - Bảo mật dữ liệu: bảo vệ dữ liệu không bị khám phá bởi người không có quyền. Chẳng hạn như dùng các ký hiệu khác để thay thế các ký hiệu trong bản tin, mà chỉ người có bản quyền mới có thể khôi phục nguyên bản của nó. - Toàn vẹn dữ liệu: tin tưởng là dữ liệu được gửi từ người có quyền. Nếu có thay đổi như làm trì hoãn về mặt thời gian hay sửa đổi thông tin, thì xác thực sẽ cho cách kiểm tra nhận biết là có các hiện tượng đó đã xảy ra. - Không từ chối: chống lại việc chối bỏ của một trong các bên tham gia trao đổi. Người gửi cũng không trối bỏ là mình đã gửi thông tin với nội dung như vậy và người nhận không thể nói dối là tôi chưa nhận được thông tin đó. Điều này là rất cần thiết trong việc trao đổi, thỏa thuận thông tin hàng ngày. Cơ chế an toàn được định nghĩa trong X800 như sau: - Cơ chế an toàn chuyên dụng được cài đặt trong một giao thức của một tầng vận chuyển nào đó: mã hoá, chữ ký điện tử, quyền truy cập, toàn vẹn dữ liệu, trao đổi có phép, đệm truyền, kiểm soát định hướng, công chứng. - Cơ chế an toàn phổ dụng không chỉ rõ được dùng cho giao thức trên tầng nào hoặc dịch vụ an ninh cụ thể nào: chức năng tin cậy cho một tiêu chuẩn nào đó, nhãn an toàn chứng tỏ đối tượng có tính chất nhất định, phát hiện sự kiện, vết theo dõi an toàn, khôi phục an toàn. 1.3.2 Mô hình an toàn mạng tổng quát Sử dụng mô hình trên đòi hỏi chúng ta phải thiết kế: o thuật toán phù hợp cho việc truyền an toàn. o Phát sinh các thông tin mật (khoá) được sử dụng bởi các thuật toán. o Phát triển các phương pháp phân phối và chia sẻ các thông tin mật. o đặc tả giao thức cho các bên để sử dụng việc truyền và thông tin mật cho các dịch vụ an toàn. 8
  • 9. cập mạng an toàn: Sử dụng mô hình trên đòi hỏi chúng ta phải: o Lựa chọn hàm canh cổng phù hợp cho người sử dụng có danh tính. o Cài đặt kiểm soát quyền truy cập để tin tưởng rằng chỉ có người có quyền mới truy cập được thông tin đích hoặc nguồn. o Các hệ thống máy tính tin cậy có thể dùng mô hình này. 1.4 Bảo mật thông tin trong hệ cơ sở dữ liệu 1.4.1 Giới thiệu chung Các hệ cơ sở dữ liệu (CSDL) ngày nay như Oracle, SQL/Server, DB2/Informix đều có sẵn các công cụ bảo vệ tiêu chuẩn như hệ thống định danh và kiểm soát truy xuất. Tuy nhiên, các biện pháp bảo vệ này hầu như không có tác dụng trước các tấn công từ bên trong. Để bảo vệ thông tin khỏi mối đe dọa này, người ta đưa ra hai giải pháp. Giải pháp đơn giản nhất bảo vệ dữ liệu trong CSDL ở mức độ tập tin, chống lại sự truy cập trái phép vào các tập tin CSDL bằng hình thức mã hóa. Tuy nhiên, giải pháp này không cung cấp mức độ bảo mật truy cập đến CSDL ở mức độ bảng, cột và dòng. Một điểm yếu nữa của giải pháp này là bất cứ ai với quyền truy xuất CSDL đều có thể truy cập vào tất cả dữ liệu trong CSDL cũng có nghĩa là cho phép các đối tượng với quyền quản trị truy cập tất cả các dữ liệu nhạy cảm. Giải pháp thứ hai, giải quyết vấn đề mã hóa ở mức ứng dụng. Giải pháp này xử lý mã hóa dữ liệu trước khi truyền dữ liệu vào CSDL. Những vấn đề về quản lý khóa và quyền truy cập được hỗ trợ bởi ứng dụng. Truy vấn dữ liệu đến CSDL sẽ trả kết quả 9
  • 10. dạng mã hóa và dữ liệu này sẽ được giải mã bởi ứng dụng. Giải pháp này giải quyết được vấn đề phân tách quyền an toàn và hỗ trợ các chính sách an toàn dựa trên vai trò. 1.4.2 Một số mô hình bảo mật cơ sở dữ liệu Để đáp ứng những yêu cầu về bảo mật cho các hệ thống CSDL hiện tại và sau này người ta đưa ra 2 mô hình bảo mật CSDL thông thường sau đây Xây dựng tầng CSDL trung gian: Một CSDL trung gian được xây dựng giữa ứng dụng và CSDL gốc. CSDL trung gian này có vai trò mã hóa dữ liệu trước khi cập nhật vào CSDL gốc, đồng thời giải mã dữ liệu trước khi cung cấp cho ứng dụng. CSDL trung gian đồng thời cung cấp thêm các chức năng quản lý khóa, xác thực người dùng và cấp phép truy cập. Giải pháp này cho phép tạo thêm nhiều chức năng về bảo mật cho CSDL. Tuy nhiên, mô hình CSDL trung gian đòi hỏi xây dựng một ứng dụng CSDL tái tạo tất cả các chức năng của CSDL gốc. Mô hình trung gian Sử dụng cơ chế sẵn có trong CSDL Mô hình này giải quyết các vấn đề mã hóa cột dựa trên các cơ chế sau: a. Các hàm Stored Procedure trong CSDL cho chức năng mã hóa và giải mã b. Sử dụng cơ chế View trong CSDL tạo các bảng ảo, thay thế các bảng thật đã được mã hóa. c. Cơ chế “instead of” trigger được sử dụng nhằm tự động hóa quá trình mã hóa từ View đến bảng gốc. Trong mô hình này, dữ liệu trong các bảng gốc sẽ được mã hóa, tên của bảng gốc được thay đổi. Một bảng ảo được tạo ra mang tên của bảng gốc, ứng dụng sẽ truy cập đến bảng ảo này. Truy xuất dữ liệu trong mô hình này có thể được tóm tắt như sau: 10
  • 11. ảo Các truy xuất dữ liệu đến bảng gốc sẽ được thay thế bằng truy xuất đến bảng ảo. Bảng ảo được tạo ra để mô phỏng dữ liệu trong bảng gốc. Khi thực thi lệnh “select”, dữ liệu sẽ được giải mã cho bảng ảo từ bảng gốc (đã được mã hóa). Khi thực thi lệnh “Insert, Update”, “instead of” trigger sẽ được thi hành và mã hóa dữ liệu xuống bảng gốc. Quản lý phân quyền truy cập đến các cột sẽ được quản lý ở các bảng ảo. Ngoài các quyền cơ bản do CSDL cung cấp, hai quyền truy cập mới được định nghĩa: 1. Người sử dụng chỉ được quyền đọc dữ liệu ở dạng mã hóa. Quyền này phù hợp với những đối tượng cần quản lý CSDL mà không cần đọc nội dung dữ liệu. 2. Người sử dụng được quyền đọc dữ liệu ở dạng giải mã. 1.4.3 Sơ lược kiến trúc của 1 hệ bảo mật CSDL Triggers: các trigger được sử dụng để lấy dữ liệu đến từ các câu lệnh INSERT, UPDATE (để mã hóa). Views: các view được sử dụng để lấy dữ liệu đến từ các câu lệnh SELECT (để giải mã). Extended Stored Procedures: được gọi từ các Trigger hoặc View dùng để kích hoạt các dịch vụ được cung cấp bởi Modulo DBPEM từ trong môi trường của hệ quản tri CSDL. DBPEM (Database Policy Enforcing Modulo): cung cấp các dịch vụ mã hóa/giải mã dữ liệu gửi đến từ các Extended Stored Procedures và thực hiện việc kiểm tra quyền truy xuất của người dùng (dựa trên các chính sách bảo mật được lưu trữ trong CSDL về quyền bảo mật). 11
  • 12. hệ bảo mật CSDL Security Database: lưu trữ các chính sách bảo mật và các khóa giải mã. Xu hướng ngày nay thường là lưu trữ CSDL về bảo mật này trong Active Directory (một CSDL dạng thư mục để lưu trữ tất cả thông tin về hệ thống mạng). Security Services: chủ yếu thực hiện việc bảo vệ các khóa giải mã được lưu trong CSDL bảo mật. Management Console: dùng để cập nhật thông tin lưu trong CSDL bảo mật (chủ yếu là soạn thảo các chính sách bảo mật) và thực hiện thao tác bảo vệ một trường nào đó trong CSDL để đảm bảo tối đa tính bảo mật, thông tin được trao đổi. Câu hỏi và bài tập 1. Trình bày các khái niệm về an toàn thông tin và bảo mật thông tin 2. Vai trò của an toàn thông tin và bảo mật thông tin 3. Các nguy cơ tấn công vào hệ thống thông tin 4. Các yêu cầu cũng như mục tiêu của việc đảm bảo an toàn và bảo mật thông tin 5. Quy trình và mô hình đảm bảo an toàn thông tin và bảo mật thông tin 6. Định hướng để tăng cường an toàn thông tin và bảo mật thông tin 7. Trình bày mô hình mạng an toàn 8. Trình bày kiến trúc bảo mật CSDL. 12
  • 13. CỔ ĐIỂN Mã hoá cổ điển là phương pháp mã hoá đơn giản nhất xuất hiện đầu tiên trong lịch sử ngành mã hoá. Thuật toán đơn giản và dễ hiểu. Những phương pháp mã hoá này là cơ sở cho việc nghiên cứu và phát triển thuật toán mã hoá đối xứng được sử dụng ngày nay. Trong mã hoá cổ điển có hai phương pháp nổi bật đó là: - Mã hoá thay thế - Mã hoá hoán vị Mọi mã cổ điển đều là mã đối xứng mà chúng ta sẽ xét trong phần sau. 2.1 Mã đối xứng. 2.1.1 Các khái niệm cơ bản Mật mã đối xứng sử dụng cùng một khóa cho việc mã hóa và giải mã. Có thể nói mã đối xứng là mã một khoá hay mã khóa riêng hay mã khoá thỏa thuận. Ở đây người gửi và người nhận chia sẻ khoá chung K, mà họ có thể trao đổi bí mật với nhau. Ta xét hai hàm ngược nhau: E là hàm biến đổi bản rõ thành bản mã và D là hàm biến đổi bản mã trở về bản rõ. Giả sử X là văn bản cần mã hóa và Y là dạng văn bản đã được thay đổi qua việc mã hóa. Khi đó ta ký hiệu: Y = EK(X) X = DK(Y) Mọi thuật toán mã cổ điển đều là mã khoá đối xứng, vì ở đó thông tin về khóa được chia sẻ giữa người gửi và người nhận. Mã đối xứng là kiểu duy nhất trước khi phát minh ra khoá mã công khai (còn được gọi là mã không đối xứng) vào những năm 1970. Hiện nay các mã đối xứng và công khai tiếp tục phát triển và hoàn thiện. Mã công khai ra đời hỗ trợ mã đối xứng chứ không thay thế nó, do đó mã đối xứng đến nay vẫn được sử dụng rộng rãi. Sau đây ta đưa ra định nghĩa một số khái niệm cơ bản về mã hóa. 1. Bản rõ X được gọi là là bản tin gốc. Bản rõ có thể được chia nhỏ có kích thước phù hợp. 2. Bản mã Y là bản tin gốc đã được mã hoá. Ở đây ta thường xét phương pháp mã hóa mà không làm thay đổi kích thước của bản rõ, tức là chúng có cùng độ dài. 3. Mã là thuật toán E chuyển bản rõ thành bản mã. Thông thường chúng ta cần thuật toán mã hóa mạnh, cho dù kẻ thù biết được thuật toán, nhưng không biết thông tin về khóa cũng không tìm được bản rõ. 4. Khoá K là thông tin tham số dùng để mã hoá, chỉ có người gửi và nguời nhận biết. Khóa là độc lập với bản rõ và có độ dài phù hợp với yêu cầu bảo mật. 5. Mã hoá là quá trình chuyển bản rõ thành bản mã, thông thường bao gồm việc áp dụng thuật toán mã hóa và một số quá trình xử lý thông tin kèm theo. 6. Giải mã chuyển bản mã thành bản rõ, đây là quá trình ngược lại của mã hóa. 7. Mật mã là chuyên ngành khoa học của Khoa học máy tính nghiên cứu về các nguyên lý và phương pháp mã hoá. Hiện nay người ta đưa ra nhiều chuẩn an toàn cho các lĩnh vực khác nhau của công nghệ thông tin. 8. Thám mã nghiên cứu các nguyên lý và phương pháp giải mã mà không biết khoá. Thông thường khi đưa các mã mạnh ra làm chuẩn dùng chung giữa các người sử dụng, các mã đó được các kẻ thám mã cũng như những người phát 13
  • 14. hiểu nghiên cứu các phương pháp giải một phần bản mã với các thông tin không đầy đủ. 9. Lý thuyết mã bao gồm cả mật mã và thám mã. Nó là một thể thống nhất, để đánh giá một mã mạnh hay không, đều phải xét từ cả hai khía cạnh đó. Các nhà khoa học mong muốn tìm ra các mô hình mã hóa khái quát cao đáp ứng nhiều chính sách an toàn khác nhau. Mô hình mã đối xứng 2.1.2 Các yêu cầu. Một mã đối xứng có các đặc trưng là cách xử lý thông tin của thuật toán mã, giải mã, tác động của khóa vào bản mã, độ dài của khóa. Mối liên hệ giữa bản rõ, khóa và bản mã càng phức tạp càng tốt, nếu tốc độ tính toán là chấp nhận được. Cụ thể hai yêu cầu để sử dụng an toàn mã khoá đối xứng là 1. Thuật toán mã hoá mạnh. Có cơ sở toán học vững chắc đảm bảo rằng mặc dù công khai thuật toán, mọi người đều biết, nhưng việc thám mã là rất khó khăn và phức tạp nếu không biết khóa. 2. Khoá mật chỉ có người gửi và người nhận biết. Có kênh an toàn để phân phối khoá giữa các người sử dụng chia sẻ khóa. Mối liên hệ giữa khóa và bản mã là không nhận biết được. 2.1.3 Mật mã Hệ mật mã được đặc trưng bởi các yếu tố sau - Kiểu của thao tác mã hoá được sử dụng trên bản rõ: 1. Phép thế - thay thế các ký tự trên bản rõ bằng các ký tự khác 2. Hoán vị - thay đổi vị trí các ký tự trong bản rõ, tức là thực hiện hoán vị các ký tự của bản rõ. 3. Tích của chúng, tức là kết hợp cả hai kiểu thay thế và hoán vị các ký tự của bản rõ. - Số khoá được sử dụng khi mã hóa: một khoá duy nhất - khoá riêng hoặc hai khoá - khoá công khai. Ngoài ra còn xem xét số khóa được dùng có nhiều không. - Một đặc trưng của mã nữa là cách mà bản rõ được xử lý, theo: 1. Khối - dữ liệu được chia thành từng khối có kích thước xác định và áp dụng thuật toán mã hóa với tham số khóa cho từng khối. 2. Dòng - từng phần tử đầu vào được xử lý liên tục tạo phần tử đầu ra tương ứng. 3. 2.1.4 Thám mã. 14
  • 15. tiếp cận tấn công mã đối xứng. 1. Tấn công thám mã dựa trên thuật toán và một số thông tin về các đặc trưng chung về bản rõ hoặc một số mẫu bản rõ/bản mã. Kiểu tấn công này nhằm khai phá các đặc trưng của thuật toán để tìm bản rõ cụ thể hoặc tìm khóa. Nếu tìm được khóa thì là tai họa lớn. 2. Tấn công duyệt toàn bộ: kẻ tấn công tìm cách thử mọi khóa có thể trên bản mã cho đến khi nhận được bản rõ. Trung bình cần phải thử một nửa số khóa mới tìm được. Các kiểu tấn công thám mã. - Chỉ dùng bản mã: biết thuật toán và bản mã, dùng phương pháp thống kê, xác định bản rõ. - Biết bản rõ: biết thuật toán, biết được bản mã/bản rõ tấn công tìm khóa. - Chọn bản rõ: chọn bản rõ và nhận được bản mã, biết thuật toán tấn công tìm khóa. - Chọn bản mã: chọn bản mã và có được bản rõ tương ứng, biết thuật toán tấn công tìm khóa. - Chọn bản tin: chọn được bản rõ hoặc mã và mã hoặc giải mã tuơng ứng, tấn công tìm khóa. 2.1.5 Tìm duyệt tổng thể (Brute-Force) Về mặt lý thuyết phương pháp duyệt tổng thể là luôn thực hiện được, do có thể tiến hành thử từng khoá, mà số khoá là hữu hạn. Phần lớn công sức của các tấn công đều tỷ lệ thuận với kích thước khoá. Khóa càng dài thời gian tìm kiếm càng lâu và thường tăng theo hàm mũ. Ta có thể giả thiết là kẻ thám mã có thể dựa vào bối cảnh để biết hoặc nhận biết được bản rõ. Sau đây là một số thống kê về mối liên hệ giữa độ dài khóa, kích thước không gian khóa, tốc độ xử lý và thời gian tìm duyệt tổng thể. Chúng ta nhận thấy với độ dài khóa từ 128 bit trở lên, thời gian yêu cầu là rất lớn, lên đến hàng tỷ năm, như vậy có thể coi phương pháp duyệt tổng thể là không hiện thực. Key Size (bits) Number of Alternative Keys Time required at 1 encryption/ µ s Time required at 106 encryptions/ µ s 32 223 = 43 x 109 231 µ s = 35.8 minutes 2.15 miniseconds 56 256 =7.2 x 1016 255 µ s = 1142 years 10.01 hours 128 2128 = 7.2 x 1038 2127 µ s = 5.4 x 1024 years 5.4 x 1018 years 168 2168 = 3.7 x 1050 2167 µ s = 5.9 x 1036 years 5.9 x 1030 years 26 characters (permution) 26! = 4 x 1026 2 x 1026 µ s = 6.4 x 1012 years 6.4 x 106 years 2.1.6 Độ an toàn. Có thể phân lọai an toàn thành hai kiểu như sau: - An toàn không điều kiện: ở đây không quan trọng máy tính mạnh như thế nào, có thể thực hiện được bao nhiêu phép toán trong một giây, mã hoá không thể bị bẻ, vì bản mã không cung cấp đủ thông tin để xác định duy nhất bản rõ. Việc dùng bộ đệm ngẫu nhiên một lần để mã dòng cho dữ liệu mà ta sẽ xét cuối bài này được coi là an toàn không điều kiện. Ngoài ra chưa có thuật toán mã hóa nào được coi là an toàn không điều kiện. 15
  • 16. tính toán: với nguồn lực máy tính giới hạn và thời gian có hạn (chẳng hạn thời gian tính toán không quá tuổi của vũ trụ) mã hoá coi như không thể bị bẻ. Trong trường hợp này coi như mã hóa an toàn về mặt tính toán. Nói chung từ nay về sau, một thuật toán mã hóa an toàn tính toán được coi là an toàn. 2.2 Các mã thế cổ điển thay thế Có hai loại mã cổ điển là mã thay thế và mã hoán vị (hay còn gọi là dịch chuyển). Mã thay thế là phương pháp mà từng kí tự (nhóm kí tự) trong bản rõ được thay thế bằng một kí tự (một nhóm kí tự) khác để tạo ra bản mã. Bên nhận chỉ cần thay thế ngược lại trên bản mã để có được bản rõ ban đầu. Trong phương pháp mã hoán vị, các kí tự trong bản rõ vẫn được giữ nguyên, chúng chỉ được sắp xếp lại vị trí để tạo ra bản mã. Tức là các kí tự trong bản rõ hoàn toàn không bị thay đổi bằng kí tự khác mà chỉ đảo chỗ của chúng để tạo thành bản mã. Trước hết ta xét các mã cổ điển sử dụng phép thay thế các chữ của bản rõ bằng các chữ khác của bảng chữ để tạo thành bản mã. - Ở đây các chữ của bản rõ được thay bằng các chữ hoặc các số hoặc các ký tự khác. - Hoặc nếu xem bản rõ như môt dãy bít, thì phép thế thay các mẫu bít bản rõ bằng các mẫu bít bản mã. 2.2.1 Mã Ceasar Đây là mã thế được biết sớm nhất, được sáng tạo bởi Julius Ceasar. Lần đầu tiên được sử dụng trong quân sự. Việc mã hoá được thực hiện đơn giản là thay mỗi chữ trong bản rõ bằng chữ thứ ba tiếp theo trong bảng chữ cái. • Ví dụ: o Meet me after the toga party o PHHW PH DIWHU WKH WRJD SDUWB Ở đây thay chữ m bằng chữ đứng thứ 3 sau m là p (m, n, o, p); thay chữ e bằng chữ đứng thứ 3 sau e là h (e, f, g, h). • Có thể định nghĩa việc mã hoá trên qua ánh xạ trên bảng chữ cái sau: các chữ ở dòng dưới là mã của các chữ tương ứng ở dòng trên: a b c d e f g h i j k l m n o p q r s t u v w x y z D E F G H I J K L M N O P Q R S T U V W X Y Z A B C • Về toán học, nếu ta gán số thứ tự cho mỗi chữ trong bảng chữ cái. Các chữ ở dòng trên có số thứ tự tương ứng là số ở dòng dưới: a b c d e f g h i j k l m 0 1 2 3 4 5 6 7 8 9 10 11 12 n o p q r s t u v w x y z 13 14 15 16 17 18 19 20 21 22 23 24 25 thì mã Ceasar được định nghĩa qua phép tịnh tiến các chữ như sau: c = E(p) = (p + k) mod (26) p = D(c) = (c – k) mod (26) 16
  • 17. là số thứ tự của chữ trong bản rõ và c là số thứ tự của chữ tương ứng của bản mã; k là khoá của mã Ceasar. Có 26 giá trị khác nhau của k, nên có 26 khoá khác nhau. Thực tế độ dài khoá ở đây chỉ là 1, vì mọi chữ đều tịnh tiến đi một khoảng như nhau. • Thám mã Ceasar là việc làm đơn giản, do số khoá có thể có là rất ít. Chỉ có 26 khoá có thể, vì A chỉ có thể ánh xạ vào một trong số 26 chữ cái của bảng chữ cái tiếng Anh: A, B, C, …Các chữ khác sẽ được xác định bằng số bước tịnh tiến tương ứng của A. Kẻ thám mã có thể thử lần lượt từng khoá một, tức là sử dụng phương pháp tìm duyệt tổng thể. Vì số khoá ít nên việc tìm duyệt là khả thi. Cho trước bản mã, thử 26 cách dịch chuyển khác nhau, ta sẽ đoán nhận thông qua nội dung các bản rõ nhận được. Ví dụ. Bẻ bản mã "GCUA VQ DTGCM" bằng cách thử các phép tịnh tiến khác nhau của bảng chữ, ta chọn được bước tịnh tiến thích hợp là 24 và cho bản rõ là "easy to break". 2.2.2 Các mã bảng chữ đơn Bây giờ ta khắc phục nhược điểm của mã Ceasar bằng cách mã hoá các chữ không chỉ là dịch chuyển bảng chữ, mà có thể tạo ra các bước nhảy khác nhau cho các chữ. Trong một mã mỗi chữ của bản rõ được ánh xạ đến một chữ khác nhau của bản mã. Do đó mỗi cách mã như vậy sẽ tương ứng với một hoán vị của bảng chữ và hoán vị đó chính là khoá của mã đã cho. Như vậy độ dài khoá ở đây là 26 và số khoá có thể có là 26!. Số khoá như vậy là rất lớn. Ví dụ. Ta có bản mã tương ứng với bản rõ trong mã bảng chữ đơn như sau: Plain: abcdefghijklmnopqrstuvwxyz Cipher: DKVQFIBJWPESCXHTMYAUOLRGZN Plaintext: ifwewishtoreplaceletters Ciphertext: WIRFRWAJUHYFTSDVFSFUUFYA - Tính an toàn của mã trên bảng chữ đơn. Tổng cộng có 26! xấp xỉ khoảng 4 x 1026 khoá. Với khá nhiều khoá như vậy nhiều người nghĩ là mã trên bảng chữ đơn sẽ an toàn. Nhưng không phải như vậy. Vấn đề ở đây là do các đặc trưng về ngôn ngữ. Tuy có số lượng khoá lớn, nhưng do các đặc trưng về tần suất xuất hiện của các chữ trong bản rõ và các chữ tương ứng trong bản mã là như nhau, nên kẻ thám mã có thể đoán được ánh xạ của một số chữ và từ đó mò tìm ra chữ mã cho các chữ khác. Ta sẽ xét khía cạnh này cụ thể trong mục sau. - Tính dư thừa của ngôn ngữ và thám mã. Ngôn ngữ của loài người là dư thừa. Có một số chữ hoặc các cặp chữ hoặc bộ ba chữ được dùng thường xuyên hơn các bộ chữ cùng độ dài khác. Chẳng hạn như các bộ chữ sau đây trong tiếng Anh "th lrd s m shphrd shll nt wnt". Tóm lại trong nhiều ngôn ngữ các chữ không được sử dụng thường xuyên như nhau. Trong tiếng Anh chữ E được sử dụng nhiều nhất; sau đó đến các chữ T, R, N, I, O, A, S. Một số chữ rất ít dùng như: Z, J, K, Q, X. Bằng phương pháp thống kê, ta c ó thể xây dựng các bảng các tần suất các chữ đơn, cặp chữ, bộ ba chữ. o 17
  • 18. chữ cái tiếng Anh: • Sử dụng bảng tần suất vào việc thám mã Điều quan trọng là mã thế trên bảng chữ đơn không làm thay đổi tần suất tương đối của các chữ, có nghĩa là ta vẫn có bảng tần suất trên nhưng đối với bảng chữ mã tương ứng. Điều đó được phát hiện bởi các nhà khoa học Ai cập từ thế kỷ thứ 9. Do đó có cách thám mã trên bảng chữ đơn như sau: - Tính toán tần suất của các chữ trong bản mã - So sánh với các giá trị đã biết - Tìm kiếm các chữ đơn hay dùng A-I-E, bộ đôi NO và bộ ba RST; và các bộ ít dùng JK, X-Z.. - Trên bảng chữ đơn cần xác định các chữ dùng các bảng bộ đôi và bộ ba trợ giúp. Ví dụ. Thám mã bản mã trên bảng chữ đơn, cho bản mã: UZQSOVUOHXMOPVGPOZPEVSGZWSZOPFPESXUDBMETSXAIZ VUEPHZHMDZSHZOWSFPAPPDTSVPQUZWYMXUZUHSXEPYEP OPDZSZUFPOUDTMOHMQ - Tính tần suất các chữ - Đoán P và Z là e và t. - Khi đó ZW là th và ZWP là the. - Suy luận tiếp tục ta có bản rõ: it was disclosed yesterday that several informal but direct contacts have been made with political representatives in moscow 2.2.3 Mã Playfair Như chúng ta đã thấy không phải số khoá lớn trong mã bảng chữ đơn đảm bảo an toàn mã. Một trong các hướng khắc phục là mã bộ các chữ, tức là mỗi chữ sẽ được 18
  • 19. số chữ khác nhau tùy thuộc vào các chữ mà nó đứng cạnh. Playfair là một trong các mã như vậy, được sáng tạo bởi Charles Wheastone vào năm 1854 và mang tên người bạn là Baron Playfair. Ở đây mỗi chữ có thể được mã bằng một trong 7 chữ khác nhau tùy vào chữ cặp đôi cùng nó trong bản rõ. Ma trận khoá Playfair. Cho trước một từ làm khoá, với điều kiện trong từ khoá đó không có chữ cái nào bị lặp. Ta lập ma trận Playfair là ma trận cỡ 5 x 5 dựa trên từ khoá đã cho và gồm các chữ trên bảng chữ cái, được sắp xếp theo thứ tự như sau: - Trước hết viết các chữ của từ khoá vào các hàng của ma trận bắt từ hàng thứ nhất. - Nếu ma trận còn trống, viết các chữ khác trên bảng chữ cái chưa được sử dụng vào các ô còn lại. Có thể viết theo một trình tự qui ước trước, chẳng hạn từ đầu bảng chữ cái cho đến cuối. - Vì có 26 chữ cái tiếng Anh, nên thiếu một ô. Thông thuờng ta dồn hai chữ nào đó vào một ô chung, chẳng hạn I và J. - Giả sử sử dụng từ khoá MORNACHY. Lập ma trận khoá Playfair tương ứng như sau: MONAR CHYBD EFGIK LPQST UVWXZ Mã hoá và giải mã: bản rõ được mã hoá 2 chữ cùng một lúc theo qui tắc như sau: - Chia bản rõ thành từng cặp chữ. Nếu một cặp nào đó có hai chữ như nhau, thì ta chèn thêm một chữ lọc chẳng hạn X. Ví dụ, trước khi mã “balloon” biến đổi thành “ba lx lo on”. - Nếu cả hai chữ trong cặp đều rơi vào cùng một hàng, thì mã mỗi chữ bằng chữ ở phía bên phải nó trong cùng hàng của ma trận khóa (cuộn vòng quanh từ cuối về đầu), chẳng hạn “ar” biến đổi thành “RM” - Nếu cả hai chữ trong cặp đều rơi vào cùng một cột, thì mã mỗi chữ bằng chữ ở phía bên dưới nó trong cùng cột của ma trận khóa (cuộn vòng quanh từ cuối về đầu), chẳng hạn “mu” biến đổi thành “CM” - Trong các trường hợp khác, mỗi chữ trong cặp được mã bởi chữ cùng hàng với nó và cùng cột với chữ cùng cặp với nó trong ma trận khóa. Chẳng hạn, “hs” mã thành “BP”, và “ea” mã thành “IM” hoặc “JM” (tuỳ theo sở thích) An toàn của mã Playfair: - An toàn được nâng cao so hơn với bảng đơn, vì ta có tổng cộng 26 x 26 = 676 cặp. Mỗi chữ có thể được mã bằng 7 chữ khác nhau, nên tần suất các chữ trên bản mã khác tần suất của các chữ cái trên văn bản tiếng Anh nói chung. - Muốn sử dụng thống kê tần suất, cần phải có bảng tần suất của 676 cặp để thám mã (so với 26 của mã bảng đơn). Như vậy phải xem xét nhiều trường hợp hơn và tương ứng sẽ có thể có nhiều bản mã hơn cần lựa chọn. Do đó khó thám mã hơn mã trên bảng chữ đơn. - Mã Playfair được sử dụng rộng rãi nhiều năm trong giới quân sự Mỹ và Anh trong chiến tranh thế giới thứ 1. Nó có thể bị bẻ khoá nếu cho trước vài trăm chữ, vì bản mã vẫn còn chứa nhiều cấu trúc của bản rõ. 2.2.4 Các mã đa bảng 19
  • 20. làm tăng độ an toàn cho mã trên bảng chữ là sử dụng nhiều bảng chữ để mã. Ta sẽ gọi chúng là các mã thế đa bảng. Ở đây mỗi chữ có thể được mã bằng bất kỳ chữ nào trong bản mã tùy thuộc vào ngữ cảnh khi mã hoá. Làm như vậy để trải bằng tần suất các chữ xuất hiện trong bản mã. Do đó làm mất bớt cấu trúc của bản rõ được thể hiện trên bản mã và làm cho thám mã đa bảng khó hơn. Ta sử dụng từ khoá để chỉ rõ chọn bảng nào được dùng cho từng chữ trong bản tin. Sử dụng lần lượt các bảng theo từ khóa đó và lặp lại từ đầu sau khi kết thúc từ khoá. Độ dài khoá là chu kỳ lặp của các bảng chữ. Độ dài càng lớn và nhiều chữ khác nhau được sử dụng trong từ khoá thì càng khó thám mã. 2.2.5 Mã Vigenere Mã thế đa bảng đơn giản nhất là mã Vigenere. Thực chất quá trình mã hoá Vigenere là việc tiến hành đồng thời dùng nhiều mã Ceasar cùng một lúc trên bản rõ với nhiều khoá khác nhau. Khoá cho mỗi chữ dùng để mã phụ thuộc vào vị trí của chữ đó trong bản rõ và được lấy trong từ khoá theo thứ tự tương ứng. Giả sử khoá là một chữ có độ dài d được viết dạng K = K1K2…Kd, trong đó Ki nhận giá trị nguyên từ 0 đến 25. Khi đó ta chia bản rõ thành các khối gồm d chữ. Mỗi chữ thứ i trong khối chỉ định dùng bảng chữ thứ i với tịnh tiến là Ki giống như trong mã Ceasar. Trên thực tế khi mã ta có thể sử dụng lần lượt các bảng chữ và lặp lại từ đầu sau d chữ của bản rõ. Vì có nhiều bảng chữ khac nhau, nên cùng một chữ ở các vị trí khác nhau sẽ có các bước nhảy khác nhau, làm cho tần suất các chữ trong bản mã dãn tương đối đều. Giải mã đơn giản là quá trình làm ngược lại. Nghĩa là dùng bản mã và từ khoá với các bảng chữ tương ứng, nhưng với mỗi chữ sử dụng bước nhảy lui lại về đầu. Ví dụ: Để sử dụng mã Vigenere với từ khóa và bản rõ cho trước ta có thể làm như sau: - Viết bản rõ ra - Viết từ khoá lặp nhiều lần phía trên tương ứng của nó - Sử dụng mỗi chữ của từ khoá như khoá của mã Ceasar - Mã chữ tương ứng của bản rõ với bước nhảy tương ứng. - Chẳng hạn sử dụng từ khoá deceptive key: deceptivedeceptivedeceptive plaintext: wearediscoveredsaveyourself ciphertext:ZICVTWQNGRZGVTWAVZHCQYGL Để mã chữ w đầu tiên ta tìm chữ đầu của khóa là d, như vậy w sẽ được mã trên bảng chữ tịnh tiến 3 (tức là a tịnh tiến vào d). Do đó chữ đầu w được mã bởi chữ Z. Chữ thứ hai trong từ khóa là e, có nghĩa là chữ thứ hai trong bản rõ sẽ được tịnh tiến 4 (từ a tịnh tiến đến e). Như vậy thứ hai trong bản rõ e sẽ được mã bởi chữ I. Tương tự như vậy cho đến hết bản rõ. Trên thực tế để hỗ trợ mã Vigenere, người ta đã tạo ra trang Saint – Cyr để trợ giúp cho việc mã và giải mã thủ công. Đó là một bảng cỡ 26 x 26 có tên tương ứng là các chữ cái trong bảng chữ tiếng Anh. Hàng thứ i là tịnh tiến i chữ của bảng chứ cái. Khi đó chữ ở cột đầu tiên chính là khoá của bảng chữ ở cùng hàng. Do đó chữ mã của một chữ trong bản rõ nằm trên cùng cột với chữ đó và nằm trên hàng tương ứng với chữ khoá. 20
  • 21. CDEFGHIJKLMNOPQRSTUVWXYZAB D DEFGHIJKLMNOPQRSTUVWXYZABC E EFGHIJKLMNOPQRSTUVWXYZABCD F FGHIJKLMNOPQRSTUVWXYZABCDE G GHIJKLMNOPQRSTUVWXYZABCDEF H HIJKLMNOPQRSTUVWXYZABCDEFG I IJKLMNOPQRSTUVWXYZABCDEFGH J JKLMNOPQRSTUVWXYZABCDEFGHI K KLMNOPQRSTUVWXYZABCDEFGHIJ L LMNOPQRSTUVWXYZABCDEFGHIJK M MNOPQRSTUVWXYZABCDEFGHIJKL N NOPQRSTUVWXYZABCDEFGHIJKLM O OPQRSTUVWXYZABCDEFGHIJKLMN P PQRSTUVWXYZABCDEFGHIJKLMNO Q QRSTUVWXYZABCDEFGHIJKLMNOP R RSTUVWXYZABCDEFGHIJKLMNOPQ S STUVWXYZABCDEFGHIJKLMNOPQR T TUVWXYZABCDEFGHIJKLMNOPQRS U UVWXYZABCDEFGHIJKLMNOPQRST V VWXYZABCDEFGHIJKLMNOPQRSTU W WXYZABCDEFGHIJKLMNOPQRSTUV X XYZABCDEFGHIJKLMNOPQRSTUVW Y YZABCDEFGHIJKLMNOPQRSTUVWX Z ZABCDEFGHIJKLMNOPQRSTUVWXY Bảng Saint Cyr An toàn của mã Vigenere. Như vậy có chữ mã khác nhau cho cùng một chữ của bản rõ. Suy ra tần suất của các chữ bị là phẳng, nghĩa là tần suất xuất hiện các chữ trên bản mã tương đối đều nhau. Tuy nhiên chưa mất hoàn toàn, do độ dài của khoá có hạn, nên có thể tạo nên chu kỳ vòng lặp. Kẻ thám mã bắt đầu từ tần suất của chữ để xem có phải đây là mã đơn bảng chữ hay không. Giả sử đây là mã đa bảng chữ, sau đó xác định số bảng chữ trong từ khoá và lần tìm từng chữ. Như vậy cần tăng độ dài từ khoá để tăng số bảng chữ dùng khi mã để “là” tần suất của các chữ. 2.2.6 Phương pháp thám mã Kasiski Phương pháp phát triển bởi Babbage và Kasiski. Ta thấy các chữ như nhau trên bản rõ và cách nhau một khoảng đúng bằng độ dài từ khoá (chu kỳ), thì sẽ được mã bằng cùng một chữ. Như vậy từ độ lặp của các chữ trong bản mã có thể cho phép xác định chu kỳ. Tất nhiên không phải khi nào cũng tìm được độ dài từ khoá. Sau đó tìm các 21
  • 22. khoá bằng cách tấn công từng bảng chữ đơn với cùng kỹ thuật dựa trên các bảng tần suất của các bộ chữ như trước. 2.3 Các mã thế cổ điển hoán vị Trong các mục trước chúng ta đã xét một số mã thay thế, ở đó các chữ của bản rõ được thay thế bằng các chữ khác của bản mã. Bây giờ chúng ta xét đến loại mã khác, mã hoán vị, các chữ trong bản rõ không được thay thế bằng các chữ khác mà chỉ thay đổi vị trí, tức là việc mã hoá chỉ dịch chuyển vị trí tương đối giữa các chữ trong bản rõ. Như vậy, nó dấu bản rõ bằng cách thay đổi thứ tự các chữ, nó không thay đổi các chữ thực tế được dùng. Do đó bản mã có cùng phân bố tần suất xuất hiện các chữ như bản gốc. Như vậy có thể thám mã để phát hiện được. 2.3.1 Mã Rail Fence Đây là mã hoán vị đơn giản. Viết các chữ của bản rõ theo đường chéo trên một số dòng. Sau đó đọc các chữ theo theo từng dòng sẽ nhận được bản mã. Số dòng chính là khoá của mã. Vì khi biết số dòng ta sẽ tính được số chữ trên mỗi dòng và lại viết bản mã theo các dòng sau đó lấy bản rõ bằng cách viết lại theo các cột. Ví dụ. Viết bản tin “meet me after the toga party” lần lượt trên hai dòng như sau m e m a t r h t g p r y e t e f e t e o a a t Sau đó ghép các chữ ở dòng thứ nhất với các chữ ở dòng thứ hai cho bản mã: MEMATRHTGPRYETEFETEOAAT 2.3.2 Mã dịch chuyển dòng Mã có sơ đồ phức tạp hơn. Viết các chữ của bản tin theo các dòng với số cột xác định. Sau đó thay đổi thứ tự các cột theo một dãy số khoá cho truớc, rồi đọc lại chúng theo các cột để nhận được bản mã. Quá trình giải mã được thực hiện ngược lại. Ví dụ: Key: 4 3 1 2 5 6 7 Plaintext: a t t a c k p o s t p o n e d u n t i l t w o a m x y z Ta đọc theo thứ tự các cột từ 1 đến 7 để nhận được bản mã: Ciphertext: TTNAAPTMTSUOAODWCOIXKNLYPETZ 2.3.2 Mã tích Mã dùng hoán vị hoặc dịch chuyển không an toàn vì các đặc trưng tần xuất của ngôn ngữ không thay đổi. Có thể sử dụng một số mã liên tiếp nhau sẽ làm cho mã khó hơn. Mã cổ điển chỉ sử dụng một trong hai phương pháp thay thế hoặc hoán vị. Người ta nghĩ đến việc kết hợp cả hai phương pháp này trong cùng một mã và có thể sử dụng đan xen hoặc lặp nhiều vòng. Đôi khi ta tưởng lặp nhiều lần cùng một loại mã sẽ tạo 22
  • 23. tạp hơn, nhưng trên thực tế trong một số trường hợp về bản chất chúng cũng tương đương với một lần mã cùng loại nào đó như: tích của hai phép thế sẽ là một phép thế; tích của hai phép hoán vị sẽ là một phép hoán vị. Nhưng nếu hai loại mã đó khác nhau thì sẽ tạo nên mã mới phức tạp hơn, chính vì vậy phép thế được nối tiếp bằng phép dịch chuyển sẽ tạo nên mã mới khó hơn rất nhiều. Đây chính là chiếc cầu nối từ mã cổ điển sang mã hiện đại. Điểm yếu của mã cổ điển: - Phương pháp mã hoá cổ điển có thể dễ dàng bị giải mã bằng cách đoán chữ dựa trên phương pháp thống kê tần xuất xuất hiện các chữ cái trên mã và so sánh với bảng thống kê quan sát của bản rõ. - Để dùng được mã hoá cổ điển thì bên mã hoá và bên giải mã phải thống nhất với nhau về cơ chế mã hoá cũng như giải mã. Nếu không thì hai bên sẽ không thể làm việc được với nhau. 2.4 Một số vấn đề khác. 2.4.1 Máy quay Trước khi có mã hiện đại, máy quay là mã tích thông dụng nhất. Chúng được sử dụng rộng rãi trong chiến tranh thế giới thứ hai: Đức, đồng minh và Nhật. Máy quay tạo nên mã thay thế rất đa dạng và phức tạp. Trong máy có sử dụng một số lõi hình trụ, mỗi lõi ứng với một phép thế, khi quay sẽ thay thế mỗi chữ bằng một chữ khác tương ứng. Với 3 hình trụ khác nhau, ta có 26 x 26 x 26 = 17576 bảng chữ. 2.4.2 Dấu tin Một trong những kỹ thuật khác để đảm bảo tính bảo mật của thông tin được gửi là dấu tin. Đây là một sự lựa chọn dùng kết hợp hoặc đồng thời với mã. Dấu tin là dấu sự tồn tại của bản tin cần bảo mật trong một thông tin khác như: trong bản tin dài chỉ dùng một tập con các chữ/từ được đánh dấu bằng cách nào đó; sử dụng mực không nhìn thấy; dấu tin trong các file âm thanh hoặc hình ảnh. Các kỹ thuật này gần đây cũng được quan tâm nghiên cứu. Tuy nhiên nó có nhược điểm là chỉ dấu được lượng thông tin nhỏ các bít. 23
  • 24.
  • 25. bài tập Câu hỏi 1. Nêu thuật toán dùng bảng Saint Cyr để mã hóa và giải mã Vigenere khi biết từ khóa. Áp dụng thuật toán đó mã hóa bản rõ sau: “Network Security is very important for software development” với từ khóa là “COMPUTER SCIENCE” 2. Có bao nhiêu khóa Playfair khác nhau. 3. Giả sử dùng mã dịch chuyển dòng với 8 cột. Hỏi có bao nhiêu khóa khác nhau. Nêu thuật toán giải mã với từ khóa cho trước. Bài tập: Bài tập 1: Cho biến đọan mã sau dùng mã Ceasar "GCUA VQ DTGCM" Suy luận tìm bản rõ (sử dụng bảng chữ cái tiếng Anh). Bài tập 2: Sử dụng kỹ thuật thám mã bảng chữ đơn, lập bảng tần suất các chữ, bộ chữ đôi, bộ chữ ba của đọan mã sau: UZQSOVUOHXMOPVGPOZPEVSGZWSZOPFPESXUDBMETSXAIVUEPHZHMDZSH ZOWSFPAPPDTSVPQUZWYMXUZUHSXEPYEPOPDZSZUFPOUDTMOHMQ Lập luận và cho biết ánh xạ của bảng chữ đơn và đưa ra bản rõ phù hợp Bài tập 3: Tìm bản mã của bản rõ “We are studying cryptography this year” sử dụng mã Playfair với từ khóa “information technology”. Bài tập 4: Mã hóa bản rõ “Chung toi se la nhung ky su cong nghe thong tin gioi trong mot vai nam nua” sử dụng từ khóa 631425 bằng phương pháp Vigenere. Bài tập 5: Cho hệ mã Vigenere có M = 6, K = “CIPHER”. a) Hãy thực hiện mã hóa xâu P = “THIS IS MY TEST“. b) Hãy thực hiện giải mã xâu M = “EICJIC RTPUEI GBGLEK CBDUGV”. Bài tập 6: Cho hệ mã Vigenere có M = 6. Mã hóa xâu P = “THIS IS MY TEST“ người ta thu được bản mã là “LLKJML ECVVWM”. a) Hãy tìm khóa mã hóa đã dùng của hệ mã trên. b) Dùng khóa tìm đƣợc ở phần trên hãy giải mã bản mã C = “KLGZWT OMBRVW”. Bài tập 7: Cho hệ mã Vigenere có M = 6. Mã hóa xâu P = “SPIRIT“ người ta thu được bản mã là “OXHRZW”. a) Hãy tìm khóa mã hóa đã dùng của hệ mã trên. b) Dùng khóa tìm đƣợc ở phần trên hãy giải mã bản mã C = “BQETYH HMBEEW”. Bài tập 8: Cho hệ mã Vigenere có M = 6. Giải mã xâu C = “RANJLV” người ta thu được bản rõ là “CIPHER”. a) Tìm khóa đã sử dụng của hệ mã trên. b) Dùng khóa tìm được ở phần trên hãy hãy giải mã xâu M = “PLDKCI DUJQJO“. Bài tập 9: Phương pháp mã hóa thay thế đơn giản Đoạn văn bản sau được mã hóa bằng cách sử dụng một phương pháp mã hóa thay thế đơn giản. Bản rõ là một phần của một văn bản tiếng Anh viết hoa, bỏ qua các dấu câu. Hãy sử dụng bảng thống kê tần suất xuất hiện của các chữ cái trong tiếng Anh để giải mã bản mã đã cho. 25
  • 26. BOEE QRROHOCS QV GIUR KIA QF Q DQCQSLR WIR ICL IW CQFQF EIYQE YIDJUVLR FGFVLDF GIU SLV OCVI GIUR IWWOYL IC VXQV DICPQG DIRCOCS VI WOCP VXL JXICLF ROCSOCS LHLRG YQEELR OF Q POFVRQUSXV YICWUFLP CQFQ BIRMLR QCP LHLRG YQEELR QFFURLF GIU VXQV XOF IR XLR WOEL IR QYYIUCVOCS RLYIRP IR RLFLQRYX JRIKLYV LHLRG ICL IW BXOYX OF DOFFOCS WRID VXL YIDJUVLR FGFVLD OF QAFIEUVLEG HOVQE Sử dụng một trong các ngôn ngữ lập trình C, C++, Java hoặc C# để làm các bài tập sau: Bài tập 10: Viết chương trình đếm tần số xuất hiện của các chữ cái tiếng Anh trong một văn bản tiếng Anh ở dạng file text. Bài tập 11: Viết chương trình cài đặt thuật toán mã hóa và giải mã của hệ mã Ceasar. 26
  • 27. SỞ TOÁN HỌC Mở đầu Số nguyên tố, số học đồng dư là cơ sở toán học của lý thuyết mật mã, có vai trò rất quan trọng trong lý thuyết mật mã. Chương này trình bày tóm tắt một số kiến thức về số nguyên tố và số học đồng dư. 3.1 Số học trên Modulo 3.1.1 Định nghĩa Modulo. Cho số tự nhiên n và số nguyên a. Ta định nghĩa: a mod n là phần dư dương khi chia a cho n. Định nghĩa quan hệ tương đương trên tập số nguyên a ≡ b mod n khi và chỉ khi a và b có phần dư như nhau khi chia cho n. o Ví dụ: 100 mod 11 = 1; 34 mod 11 = 1, nên 100 ≡ 34 mod 11 o Số b được gọi là đại diện của a, nếu o o a ≡ b mod n, (a = qn + b) và 0 <= b < n. o Ví dụ: -12 mod 7 ≡ -5 mod 7 ≡ 2 mod 7 ≡ 9 mod 7. Ở đây 2 là đại diện của –12, -5, 2 và 9. o Trong Modulo 7 ta có các lớp tương đương viết trên các hàng như sau: ... -21 -20 -19 -18 -17 -16 -15 -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 ... Các phần tử cùng cột là có quan hệ đồng dư với nhau. Tập các đại diện của các số nguyên theo Modulo n gồm n phần tử ký hiệu như sau: Zn = { 0, 1, 2, 3, …, n-1 }. Ước số o Số b không âm được gọi là ước số của a, nếu có số m sao cho: a = m.b trong đó a, b, m đều nguyên. o Tức là a chia hết cho b, ký hiệu là b|a 27
  • 28. 1, 2, 3, 4, 6, 8, 12, 24 là các ước số của 24 3.1.2 Các phép toán số học trên Modulo Cho trước một số n. Ta muốn thực hiện các phép toán theo Modulo của n. Ta có thể thực hiện các phép toán trên các số nguyên như các phép cộng, nhân các số nguyên thông thường sau đó rút gọn lại bằng phép lấy Modulo hoặc cũng có thể vừa tính toán, kết hợp với rút gọn tại bất cứ thời điểm nào: (a+b) mod n = [a mod n + b mod n] mod n (*) (a.b) mod n = [a mod n . b mod n] mod n (**) Như vậy khi thực hiện các phép toán ta có thể thay các số bằng các số tương đương theo Modulo n đó hoặc đơn giản hơn có thể thực hiện các phép toán trên các đại diện của nó: Zn = { 0, 1, 2, 3, …, n-1 }. o Các chú ý về tính chất rút gọn:  nếu (a+b)≡(a+c) mod n, thì b≡c mod n  Nhưng (ab)≡(ac) mod n, thì b≡c mod n chỉ khi nếu a là nguyên tố cùng nhau với n Ví dụ. Áp dụng các tính chất của modulo: (11*19 + 10 17 ) mod 7 = ((11*19) mod 7 + 10 17 mod 7) mod 7 = ((11 mod 7* 19 mod 7) mod 7 + (10 mod 7) 17 mod 7) mod 7= ((4.(-2)) mod 7 + (((3 2 ) 2 ) 2 ) 2 * 3 mod 7)mod 7= ((-1) mod 7 + ((2 2 ) 2 ) 2 * 3 mod 7)mod 7 = (-1 + 5) mod 7 = 4 Ví dụ: Bảng Modulo 8 với phép cộng 3.1.3 Ước số chung lớn nhất. 28
  • 29. Cho hai số nguyên dương a và b. Bài toán tìm ước chung lớn nhất của hai số nguyên dương là bài toán chung của lý thuyết số. Ta ký hiệu GCD(a, b) là ước số chung dương lớn nhất của a và b, tức là số nguyên dương vừa là ước của a vừa là ước của b và là số nguyên dương lớn nhất có tính chất đó. Ví dụ: GCD(60,24) = 12 ; GCD (6, 15) = 3; GCD(8, 21) = 1. • Nguyên tố cùng nhau. Ta thấy 1 bao giờ cũng là ước số chung của hai số nguyên dương bất kỳ. Nếu GCD(a, b) = 1, thì a, b đựơc gọi là hai số nguyên tố cùng nhau: Ví dụ: GCD(8,15) = 1, tức là 8 v à 15 là hai số nguyên tố cùng nhau • Tìm ước chung lớn nhất. Bây giờ chúng ta xét bài toán tìm ước số chung lớn nhất của hai số nguyên dương cho trước. Dễ dàng chứng minh được tính chất sau: GCD(a,b) = GCD(b, a mod b) Như vậy để tìm ước số chung của một cặp số cho trước, ta đưa về bài toán tìm ước chung của cặp số gồm số nhỏ hơn trong hai số đó và phần dư của số lớn khi chia cho số nhỏ hơn. Thuật toán Ơcơlít tạo nên vòng lặp, ở mỗi bước ta áp dụng tính chất trên cho đến khi phần dư đó còn khác 0. • • Thuật toán Ơclit tìm GCD(a, b) Tính UCLN của 2 số nguyên VÀO : Hai số nguyên không âm a và b với b a > RA : ƯCLN của a và b. (1) While 0 b ≠ do r b , b a , b mod a r ← ← ← (2) Return (a). Ví dụ: Sau đây là các bước chia của thuật toán trên khi tính: ( ) 0 38 . 2 76 38 114 . 5 646 76 646 . 2 1406 . 646 1406 . 2 3458 1406 3458 . 1 4864 38 3458 , 4864 + = + = + = + = + = = Thuật toán trên có thể được mở rộng để không những chỉ tính được ƯCLN của 2 số nguyên a và b mà còn tính được các số nguyên x và y thoả mãn d by ax = + . • Thuật toán Euclide mở rộng: 29
  • 30. số nguyên không âm a và b với b a ≥ RA : ( ) b , a UCLN d = và các số nguyên x và y thoả mãn d by ax = + . (1) Nếu 0 b = thì đặt 0 y , 1 x , a d ← ← ← và ( ) y , x , d return (2) Đặt 1 y , 0 y , 0 x , 1 x 1 2 1 2 ← ← ← ← (3) While 0 b > do 3.1. 2 1 2 1 mod , , , q a b r a qb x x qx y y qy ¬ ¬ − ¬ − ¬ − 3.2. y y , y y , x x , x x , r b , b a 1 1 2 1 1 2 ← ← ← ← ← ← (4) Đặt 2 2 y y , x x , a d ← ← ← và ( ) y , x , d return Ví dụ: Bảng sau chỉ ra các bước của thuật toán trên với các giá trị vào 4864 a = và 3458 b = Q r x y a b x2 x1 y2 y1 − − − − 4864 3458 1 0 0 1 1 1406 1 −1 3458 1406 0 1 1 −1 2 646 −2 3 1406 646 1 −2 −1 3 2 114 5 −7 646 114 −2 5 3 7 5 76 −27 38 114 76 5 −27 −7 38 1 38 32 −45 76 38 −27 32 38 −45 2 0 −91 128 38 0 32 −91 −45 128 Bởi vậy ta có ( ) 38 3458 , 4864 UCLN = và ( )( ) ( )( ) 38 45 3458 32 4864 = − + 3.2. Một số thuật toán trên Zn 3.2.1 Tìm số nghịch đảo - Định nghĩa: Phần tử nghịch đảo Cho n Z a ∈ , Phần tử nghịch đảo (ngược theo phép nhân) của n mod a là một số nguyên n Z x ∈ sao cho: ( ) n mod 1 x a ≡ Nếu x tồn tại thì nó là duy nhất, a được gọi là khả nghịch. Phần tử nghịch đảo của a được ký hiệu là 1 a− . - Thuật toán (Tính các nghịch đảo trong n Z ). VÀO : n Z a ∈ RA : n mod a 1 − (nếu tồn tại). (1) Dùng thuật toán Euclide mở rộng để tìm các số nguyên x và y sao cho d ny ax = + trong đó ( ) n , a d = . 30
  • 31. > thì n mod a 1 − không tồn tại. Ngược lại ( ) x return . Các bước tính A-1 mod N 31
  • 32. n=101, a=25 Ví dụ 2: n=173, a=1024 3.2.2. Tính A^k mod N Tính giá trị của biểu thức z = Ak mod n Thuật toán “bình phương và nhân” Biểu diễn k dạng nhị phân blbl-1...b1b0, bi∈{0, 1}, 0≤ i≤ l c  0; f 1; for i = l downto 0 do c  2 *c f  (f * f) mod n if bi = 1 then c  c + 1 f  (f*a) mod n return f 32
  • 33. sau chỉ ra các bước tính toán ak mod n, với a = 7, k = 560 = 1000110000, n = 561 i 9 8 7 6 5 4 3 2 1 0 bi 1 0 0 0 1 1 0 0 0 0 c 1 2 4 8 17 35 70 140 280 560 f 7 49 157 526 160 241 298 166 67 1 Giá trị f cuối cùng 1 là đáp số cần tìm 3.3 Giới thiệu lý thuyết số 3.3.1 Các số nguyên tố Như chúng ta đã biết số nguyên tố là các số nguyên dương chỉ có ước số là 1 và chính nó. Chúng không thể được viết dưới dạng tích của các số khác. 1 là số nguyên tố, nhưng không quan tâm đến nó. Xét các số nhỏ hơn 10 ta có: 2, 3, 5, 7 là số nguyên tố, vì chúng không có ước số khác 1 và chính nó; 4, 6, 8, 9, 10 không phải là số nguyên tố. Có thể nói 2 là số chẵn duy nhất là số nguyên tố. Các số nguyên tố là trung tâm của lý thuyết số. Số các số nguyên tố là vô hạn. Ví dụ. Sau đây là danh sách các số nguyên tố nhỏ hơn 200: 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 101 103 107 109 113 127 131 137 139 149 151 157 163 167 173 179 181 191 193 197 199 3.3.2 Phân tích ra thừa số nguyên tố Một trong những bài toán cơ bản của số học là phân tích ra thừa số nguyên tố số a, tức là viết nó dưới dạng tích của các số nguyên tố. Lưu ý rằng phân tích là bài toán khó hơn rất nhiều so với bài toán nhân các số để nhận được tích. Ta có kết luận, mọi số nguyên dương đều có phân tích duy nhất thành tích các lũy thừa của các số nguyên tố: p p P a p α ∈ = ∏ Ví dụ: 91=7×13; 3600=24×32×52 Thông thường để tìm phân tích trên, ta phải kiểm tra tính chia hết cho các số nguyên tố từ nhỏ đến lớn và thực hiện phép chia liên tiếp cho các số nguyên tố, rồi gộp thành lũy thừa của các số nguyên tố. 3.3.3 Các số nguyên tố cùng nhau và GCD Hai số nguyên dương a và b không có ước chung nào ngoài 1, được gọi là nguyên tố cùng nhau. Ví dụ: 8 và 15 là nguyên tố cùng nhau, vì ước của 8 là 1, 2, 4, 8, còn ước của 15 là 1, 3, 5, 15. Chỉ có 1 là ước chung của 8 và 15. 33
  • 34. thể xác định ước chung lớn nhất bằng cách trong các phân tích ra thừa số của chúng, tìm các thừa số nguyên tố chung và lấy bậc lũy thừa nhỏ nhất trong hai phân tích của hai số đó. Ví dụ. Ta có phân tích: 300=21×31×52 và 18=21×32. Vậy GCD(18,300)=21×31×50=6 3.3.4 Định lý Ferma (Định lý Ferma nhỏ) ap-1 mod p = 1 trong đó p là số nguyên tố và a là số nguyên bất kỳ khác bội của p: GCD(a, p) = 1. Hay với mọi số nguyên tố p và số nguyên a không là bội của p, ta luôn có ap = a mod p Công thức trên luôn đúng, nếu p là số nguyên tố, còn a là số nguyên dương nhỏ hơn p. Ví dụ. Vì 5 và 7 là các số nguyên tố. 2 và 3 không là bội tương ứng của 7 và 5, nên theo định lý Ferma ta có 27-1 mod 7 = 1 (= 26 mod 7 = 64 mod 7= 1) 35-1 mod 5 = 1 (= 34 mod 5 = 81 mod 5= 1) (-2)11-1 mod 11 = 1 (= 210 mod 11 = 1024 mod11 = 1) Kết quả trên được dùng trong khoá công khai. Nó cùng được sử dụng để kiểm tra tính nguyên tố của một số nguyên p nào đó, bằng cách lấy ngẫu nhiên các số a và kiểm tra xem có tính chất nêu trên không, kết luận là p nguyên tố càng thuyết phục nếu phép thử trên đúng với nhiều lần chọn ngẫu nhiên các số a. 3.3.5 Hàm Ole Cho n là một số nguyên dương. Khi thực hiện phép tính đồng dư n của mọi số nguyên khác ta nhận được tập đầy đủ các phần dư có thể có là: 0, 1, 2,…, n-1 Từ tập trên ta tìm tập rút gọn bao gồm các số nguyên tố cùng nhau với n và quan tâm đến số lượng các phần tử như vậy đối với số nguyên dương n cho trước. Ví dụ. Với n = 10: o Tập đầy đủ các phần dư là {0,1,2,3,4,5,6,7,8,9} o Tập rút gọn các phần dư nguyên tố với 10 là {1,3,7,9} o Số các phần tử của tập rút gọn trên là giá trị của hàm Ole Ф(n). Như vậy, Ф(10) = 4. • Muốn tính Ф(n) việc đếm số các số nguyên tố cùng nhau với n và nhỏ hơn n được loại bỏ vì đây là bài toán tốn nhiều công sức. • Nói chung có thể tính hàm Ơle của một số dựa trên biểu thức phân tích ra thừa số của số đó. o Dễ dàng thấy, nếu p là số nguyên tố Ф(p) = p-1 o Nếu p và q là hai số nguyên tố khác nhau, thì 34
  • 35. chứng minh được rằng: o Ф(p.q) = (p-1)(q-1) o Nếu p là số nguyên tố, thì Ф(pn ) = pn -pn-1 o Nếu s và t là hai số nguyên tố cùng nhau, thì Ф(s.t) = Ф(s).Ф(t) Vi dụ. Ф(37) = 37 – 1 = 36 Ф(21) = (3–1)×(7–1) = 2×6 = 12 Ф(72) = Ф(8.9) = Ф(8). Ф(9) = Ф(23 ).Ф(32 ) = = (23 -22 )(32 -31 ) = 4.6 = 24 3.3.6 Định lý Ole Định lý Ole là tổng quát hoá của Định lý Ferma aФ(n)mod n = 1 với mọi cặp số nguyên dương nguyên tố cùng nhau a và n: gcd(a,n)=1. Ví dụ. a = 3; n = 10; Ф(10)=4; Vì vậy 34 = 81 = 1 mod 10 a = 2; n =11; Ф(11)=10; Do đó 210 = 1024 = 1 mod 11 3.3.7 Kiểm tra tính nguyên tố Giả sử cần phải tìm một số nguyên tố rất lớn. Lấy ngẫu nhiên một số đủ lớn, ta cần phải kiểm tra xem số đó có phải là số nguyên tố không. Phương pháp truyền thống là thử bằng phép chia như sau: o Chia cho tất cả các số (chỉ cần nguyên tố) nhỏ hơn hoặc bằng căn bậc hai của số đó. Nếu nó không chia hết cho số nào, thì đó là số nguyên tố. o Chỉ hiệu quả khi xét các số nhỏ. Có phương pháp khác, mà ta sẽ xét ở đây, sử dụng các phép kiểm tra tính nguyên tố thống kê dựa trên các tính chất o Mà mọi số nguyên tố phải thỏa mãn o Nhưng có một số số không nguyên tố, gọi là giả nguyên tố cũng thoả mãn tính chất đó. Cụ thể là phép kiểm tra dựa trên Định lý Ferma như sau: nếu số n cần kiểm tra tính nguyên tố là số nguyên tố, thì nó sẽ thoã mãn định lý Ferma đối với mọi số a nhỏ hơn nó an-1 mod n = 1. Như vậy, lấy ngẫu nhiên số a và kiểm tra xem nó có tính chất trên không. Nếu có thì n có thể là số nguyên tố, nếu cần độ tin cậy lớn hơn, thì ta kiểm tra liên tiếp nhiều lần như vậy với các số ngẫu nhiên a được chọn. Sau mỗi lần qua được phép thử, xác suất để n là số nguyên tố lại tăng lên. Chú ý rằng - nếu bi mod n = 1, thì b2i mod n = (1)2 mod n = 1 và - nếu bi mod n = n – 1, thì b2i mod n = (n - 1)2 mod n = (n2 – 2n +1) mod n = 1 35
  • 36. n có là số nguyên tố không, ta chỉ cần xét n là lẻ, khi đó n-1 là chẵn và biểu diễn nó dạng (n–1)= 2k .q Khi đó để tính an-1 , ta tính aq , sau đó bình phương liên tiếp k lần. Thuật toán Miller - Rabin • Thuật toán như sau: TEST (n) is: 1. Find integers k, q, k > 0, q odd, so that (n–1)= 2k .q 2. Select a random integer a, 1
  • 37. 4-1 mod 7 = 2, suy ra c1 = 11*2 = 22 7-1 mod 11 = 8, suy ra c2 = 7*8 = 56 a1 = 178 mod 7 = (17 mod 7)8 mod 7 = 38 mod 7 = (32 )4 mod 7 = 2 a2 = 178 mod 11 = (17 mod 11)8 mod 11 = 68 mod 11 = (62 )4 mod 11 = 34 mod 11 = 4 Vậy A = 178 mod 77 = (2*22 + 4*56) mod 77 = 268 mod 77 = 37 mod 77 • Giải hệ phương trình modulo. Cho ai = x mod mi, với GCD(mi, mj) = 1, với mọi i khác j. Khi đó ta cũng áp dụng Định lý phần dư Trung Hoa để tìm x. Ví dụ. Cho x ≡ 5 mod 7 và x ≡ 6 mod 11. Tìm x. Áp dụng định lý phần dư Trung hoa, ta tính: 7-1 mod 11 = 8 và 11-1 mod 7 = 2. Như vậy x = (5*2*11 + 6*8*7) mod (7*11) = 61 mod 77. Câu hỏi và bài tập. 1. Tính giá trị các biểu thức theo modulo sau: • 8 mod 9 + 7 mod 9 • 8 mod 9 * 7 mod 9 • 5 mod 11 – 9 mod 11 • 53 mod 7 • 520 mod 7 • 5/6 mod 7 2. Tính giá trị các biểu thức theo modulo sau • (-546) mod 13 - 347 mod 11 • (1234 + 2345) mod 17 • (213 * 345) mod 19 • 15-1 mod 101 • 41-1 mod 100 • 1435 mod 11 • (235*126/13) mod 19 • 31130 mod 23 • (23525 /17 + 12619 . 397 /13) mod 29 3. Cài đặt thuật toán Ơclit mở rộng 4. Tính hàm Ơle của các số nguyên sau: • 12, 17, 21, 32, 36, 40, 72, 256. 8 Dùng Định lý Ferma và Định lý Ole tính các biểu thức sau • 616 mod 17; 1516 mod 17; 95100 mod 101 • 74 mod 10; 95 mod 10; 1012 mod 21; 9190 mod 100; 9 Giải các phương trình modulo sau • x mod 11 = 3; x mod 13 = 6 • y mod 51 = 11; y mod 100 = 15 • z mod 12 = 5; z mod 17 = 8; z mod 23 = 11. 10 Sử dụng định lý phần dư Trung Hoa tính giá trị các biểu thức sau • 2530 mod (7*8) • 70254 mod (11*13) 37
  • 38. ((21100 + 33-1 ). 4551 ) mod (7.9.11) • ((19125 + 2551 )4721 /37 mod (9.11.13) 38
  • 39. MÃ DỮ LIỆU (DES) VÀ CHUẨN MÃ NÂNG CAO (AES) Chương này ta xét các mã khối hiện đại. Đây là kiểu mã được sử dụng rộng rãi nhất của các thuật toán mã hoá. Đồng thời nó cũng được sử dụng kết hợp với các thủ tục khác nhằm cung cấp các dịch vụ an toàn và xác thực. Chúng ta tập trung vào chuẩn mã dữ liệu DES (Data Encryption Standards) để minh hoạ cho các nguyên lý mã khối. 4.1 Chuẩn mã dữ liệu (DES) DES (Data Encryption Standards) là mã khối sử dụng rộng rãi nhất trên thế giới trong thời gian vừa qua. Nó được đưa ra năm 1977 bởi NBS – văn phòng chuẩn Quốc gia Hoa kỳ (bây giờ là NIST - Viện chuẩn và công nghệ Quốc gia). DES là mã khối với mỗi khối dữ liệu 64 bít và dùng khoá dài 56 bít. Nó được sử dụng rộng rãi và đã được tranh luận kỹ về mặt an toàn. 4.2.1 Lịch sử DES: Cuối những năm 1960, IBM phát triển mã Lucifer, được lãnh đạo bởi Fiestel. Ban đầu Lucifer sử dụng khối dữ liệu 64 bít và khoá 128 bít. Sau đó tiếp tục phát triển như mã thương mại. Năm 1973 NBS yêu cầu đề xuất chuẩn mã Quốc gia. IBM đề nghị bản sửa đổi Lucifer, sau này gọi là DES. Đã có các tranh luận về thiết kế của DES. Vì chuẩn của DES được công khai, mọi người đóng góp ý kiến về tốc độ, độ dài khoá và mức độ an toàn, khả năng thám mã. Người ta đề xuất chọn khoá 56 bít thay vì 128 để tăng tốc đọ xử lý và đưa ra các tiêu chuẩn thiết kế một chuẩn mã dữ liệu. Các suy luận và phân tích chứng tỏ rằng thiết kế như vậy là phù hợp. Do đó DES được sử dụng rộng rãi, đặc biệt trong lĩnh vực tài chính. 4.2.2. Thuật toán DES  Mô tả DES:  DES mã hoá một xâu bit x của bản rõ độ dài 64 bằng một khoá 56 bit. Bản mã nhận được cũng là một xâu bit có độ dài 64.  Thuật toán tiến hành theo 3 bước:  B1: Với bản rõ cho trước x, một xâu bit x0 sẽ được xây dựng bằng cách hoán vị các bit của x theo phép hoán vị cố định ban đầu IP. Ta viết: x0 = IP(x) = L0R0, trong đó L0 gồm 32 bit đầu và R0 là 32 bit cuối.  B2: Sau đó tính toán 16 lần lặp theo một hàm xác định. Ta sẽ tính LiRi, 1≤ i ≤ 16 theo quy tắc sau: Li = Ri-1; Ri = Li-1 ⊕ f(Ri-1, ki)  Trong đó:  ⊕ là phép loại trừ của hai xâu bit  f là một hàm sẽ được mô tả ở sau  k1, k2, …, k16 là các xâu bit có độ dài 48 được tính như 1 hàm của khóa k (ki chính là một phép chọn hoán vị bit trong k).  Một vòng của phép mã hóa được mô tả như sau: 39
  • 40. dụng phép hoán vị ngược IP-1 cho xâu bit R16L16, ta thu được bản mã y. Tức là y = IP-1(R16L16) . Hãy chú ý thứ tự đã đảo của L16 và R16  Mô tả hàm f:  Hàm f có 2 biến vào:  Xâu bit A có độ dài 32  Xâu bit J có độ dài 48  Đầu ra của f là xâu bit có độ dài 32.  Các bước thực hiện:  B1: Biến thứ nhất A được mở rộng thành một xâu bit độ dài 48 theo một hàm mở rộng cố định E. E(A) gồm 32 bit của A (được hoán vị theo cách cố định) với 16 bit xuất hiện hai lần.  B2: Tính E(A) ⊕ J và viết kết quả thành một chuỗi 8 xâu 6 bit là B1B2B3B4B5B6B7B8.  B3: Bước tiếp theo dùng 8 bảng S1S2,…,S8 ( được gọi là các hộp S ). Với mỗi Si là một bảng 4×16 cố định có các hàng là các số nguyên từ 0 đến 15. Với xâu bit có độ dài 6 (kí hiệu Bi = b1 b2 b3 b4 b5 b6), ta tính Sj(Bj) như sau:  Hai bit b1b6 xác định biểu diễn nhị phân hàng r của Sj (0≤ r ≤ 3)  Bốn bit (b2 b3 b4 b5) xác định biểu diễn nhị phân của cột c của Sj (0≤ c ≤ 15).  Khi đó Sj(Bj) sẽ xác định phần tử Sj(r, c) ; phần tử này viết dưới dạng nhị phân là một xâu bit có độ dài 4  Bằng cách tương tự tính các Cj = Sj(Bj) , (1 ≤ j ≤ 8). 40
  • 41. bit C = C1 C2 … C8 có độ dài 32 được hoán vị theo phép hoán vị cố định P. Xâu kết quả là P(C) được xác định là f(A, J).  Phép hoán vị ban đầu IP:  Bảng này có ý nghĩa là bit thứ 58 của x là bit đầu tiên của IP(x); bit thứ 50 của x là bit thứ 2 của IP(x)  Phép hoán vị ngược IP -1 :  Hàm mở rộng E được xác định theo bảng sau: 41
  • 42. S: Cột Hàng [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] S1 [0] 14 4 13 1 2 15 11 8 3 10 6 12 5 9 0 7 [1] 0 15 7 4 14 2 13 1 10 6 12 11 9 5 3 8 [2] 4 1 14 8 13 6 2 11 15 12 9 7 3 10 5 0 [3] 15 12 8 2 4 9 1 7 5 11 3 14 10 0 6 13 S2 [0] 15 1 8 14 6 11 3 4 9 7 2 13 12 0 5 10 [1] 3 13 4 7 15 2 8 14 12 0 1 10 6 9 11 5 [2] 0 14 7 11 10 4 13 1 5 8 12 6 9 3 2 15 [3] 13 8 10 1 3 15 4 2 11 6 7 12 0 5 14 9 S3 [0] 10 0 9 14 6 3 15 5 1 13 12 7 11 4 2 8 [1] 13 7 0 9 3 4 6 10 2 8 5 14 12 11 15 1 [2] 13 6 4 9 8 15 3 0 11 1 2 12 5 10 14 7 [3] 1 10 13 0 6 9 8 7 4 15 14 3 11 5 2 12 S4 [0] 7 13 14 3 0 6 9 10 1 2 8 5 11 12 4 15 [1] 13 8 11 5 6 15 0 3 4 7 2 12 1 10 14 9 [2] 10 6 9 0 12 11 7 13 15 1 3 14 5 2 8 4 [3] 3 15 0 6 10 1 13 8 9 4 5 11 12 7 2 14 S5 [0] 2 12 4 1 7 10 11 6 8 5 3 15 13 0 14 9 [1] 14 11 2 12 4 7 13 1 5 0 15 10 3 9 8 6 [2] 4 2 1 11 10 13 7 8 15 9 12 5 6 3 0 14 [3] 11 8 12 7 1 14 2 13 6 15 0 9 10 4 5 3 S6 [0] 12 1 10 15 9 2 6 8 0 13 3 4 14 7 5 11 [1] 10 15 4 2 7 12 9 5 6 1 13 14 0 11 3 8 [2] 9 14 15 5 2 8 12 3 7 0 4 10 1 13 11 6 42
  • 43. 2 12 9 5 15 10 11 14 1 7 6 0 8 13 S7 [0] 4 11 2 14 15 0 8 13 3 12 9 7 5 10 6 1 [1] 13 0 11 7 4 9 1 10 14 3 5 12 2 15 8 6 [2] 1 4 11 13 12 3 7 14 10 15 6 8 0 5 9 2 [3] 6 11 13 8 1 4 10 7 9 5 0 15 14 2 3 12 S8 [0] 13 2 8 4 6 15 11 1 10. 9 3 14 5 0 12 7 [1] 1 15 13 8 10 3 7 4 12 5 6 11 0 14 9 2 [2] 7 11 4 1 9 12 14 2 0 6 10 13 15 3 5 8 [3] 2 1 14 7 4 10 8 13 15 12 9 0 3 5 6 11 Phép hoán vị P: 4.2.3. Quá trình sinh khoá. Từ khoá mẹ 64 bit ban đầu sinh ra 16 khoá con ứng với từng vòng theo sơ đồ sau: …………………….. Sinh khoá con. 43
  • 44. nhập vào là một chuỗi 64 bit, trong vòng đầu tiên khoá 64 bit được cho qua hộp PC-1(Permuted Choice) để hoán vị có lựa chọn thành khoá 56 bit. Hộp PC-1. Theo đó, bit thứ 57 trở thành bit đầu tiên, bit thứ 49, 41, 33, … lần lượt là các bit tiếp theo, và bit thứ 4 trở thành bit cuối cùng của chuỗi khoá. Tiếp theo chia đôi khoá 56 bit đó thành hai nửa trái và phải, mỗi nửa này sẽ được dịch vòng sang trái 1 hoặc 2 bit tuỳ mỗi vòng theo quy tắc sau: Sau khi dịch, hai nửa của khoá lại được ghép lại rồi cho vào hộp PC-2 để tiếp tục hoán vị có lựa chọn thành khoá 48 bit và đó chính là khoá con cho vòng tương ứng. Hộp PC-2. Khoá đi qua PC-2 thì bit thứ 14 trở thành bit đầu tiên, các bit thứ 17, 11, 24, … là các bit tiếp theo, bit thứ 32 là bit cuối cùng của khoá con. 44
  • 45. của DES • Tác dụng đồng loạt. Khi ta thay đổi 1 bit trong khoá sẽ gây ra tác động đồng loạt làm thay đổi nhiều bit trên bản mã. Đây là tính chất mong muốn của khoá trong thuật toán mã hoá. Nếu thay đổi 1 bít đầu vào hoặc khoá sẽ kéo theo thay đổi một nửa số bít đầu ra. Do đó không thể đoán khoá được. Co thể nói rằng DES thể hiện tác động đồng loạt mạnh. • Sức mạnh của DES – kích thước khoá. Độ dài của khoá trong DES là 56 bít có 256 = 7.2 x 1016 giá trị khác nhau. Đây là con số rất lớn nên tìm kiếm duyệt rất khó khăn. Các thành tựu gần đây chỉ ra rằng thời gian cần thiết để giải một trang mã DES mà không biết khoá là: sau một vài tháng trên Internet trong năm 1997; một vài ngày trên thiết bị phần cứng tăng cường trong năm 1998; sau 22 giờ nếu kết hợp các biện pháp trong năm 1999. Như vậy vẫn có thể đoán được bản rõ sau một khoảng thời nhất định, nếu có nguồn lực máy tính mạnh. Chính vì vậy bây giờ người ta đã xét một vài biến thể của DES nhằm nâng cao sức mạnh cho DES. • Sức mạnh của DES – tấn công thời gian. Đây là dạng tấn công vào cài đặt thực tế của mã. Ở đây sử dụng hiểu biết về quá trình cài đặt thuật toán mà suy ra thông tin về một sô khoá con hoặc mọi khoá con. Đặc biệt sử dụng kết luận là các tính toán chiếm khoảng thời gian khác nhau phụ thuộc vào giá trị đầu vào của nó. Do đó kẻ thám mã theo dõi thời gian thực hiện mà phán đoán về khoá. Có thể kẻ thám mã sáng tạo ra các loại card thông minh phán đoán khoá, mà còn phải bàn bạc thêm về chúng. • Sức mạnh của DES – tấn công thám mã. Có một số phân tích thám mã trên DES, từ đó đề xuất xây dựng một số cấu trúc sâu về mã DES. Rồi bằng cách thu thập thông tin về mã, có thể đoán biết được tất cả hoặc một số khoá con đang dùng. Nếu cần thiết sẽ tìm duyệt những khoá còn lại. Nói chung, đó là những tấn công dựa trên phương pháp thống kê bao gồm: thám mã sai phân, thám mã tuyến tính và tấn công khoá liên kết. • Thám mã sai phân Một trong những thành tựu công khai gần đây trong thám mã là phương pháp thám mã sai phân. Nó được biết đến bởi NSA trong những năm 70, chẳng hạn trong thiết kế DES. Murphy, Birham và Shamir công bố phương pháp sai phân năm 1990. Đây là phương pháp mạnh để phân tích mã khối. Nó sử dụng phân tích hầu hết các mã khối hiện tại với mức độ thành công khác nhau. Nhưng DES có thể kháng cự lại các tấn công đó. Thám mã sai phân là tấn công thống kê chống lại các mã Fiestel. Mã Fiestel dùng các cấu trúc mã chưa được sử dụng trước kia như thiết kế S-P mạng có đầu ra từ hàm f chịu tác động bởi cả đầu vào và khoá. Do đó không thể tìm lại được giá trị bản rõ mà không biết khoá. Thám mã sai phân so sánh hai cặp mã có liên quan với nhau o Với sự khác biệt đã biết ở đầu vào o Khảo sát sự khác biệt ở đầu ra o Khi với cùng khoá con được dùng o Trong công thức sau với hai đầu vào khác nhau, vế trái là sự khác biệt mã ở cùng vòng thứ i được biểu diễn qua sự khác biệt mã ở vòng trước đó i-1 và sự khác biệt của hàm f trong ngoặc vuông. 45
  • 46. 1 ' ' i-1 i-1 i-1 m ( , ) m ( , ) = m i i i i i i i m m m f m K f m K + + + ∆ = ⊕   = ⊕ ⊕ ⊕   ∆ ⊕ Sự khác biệt ở đầu vào cho sự khác biệt ở đầu ra với một xác suất cho trước. o Nếu tìm được một thể hiện đầu vào - đầu ra với xác suất cao thì có thể luận ra khoá con được sử dụng trong vòng đó o Sau đó có thể lặp lại cho nhiều vòng (với xác suất giảm dần)  Cặp đúng cho bít khoá như nhau  Cặp sai cho giá trị ngẫu nhiên o Đối với số vòng lớn, xác suất để có nhiều cặp đầu vào 64 bít thoả mãn yêu cầu là rất nhỏ. o Birham và Shamir chỉ ra rằng làm như thế nào để các đặc trưng lặp của 13 vòng có thể bẻ được DES 16 vòng đầy đủ. o Qui trình thám mã như sau: thực hiện mã hoá lặp lại với cặp bản rõ có XOR đầu vào biết trước cho đến khi nhận được XOR đầu ra mong muốn o Khi đó có thể tìm được  nếu vòng trung gian thỏa mãn XOR yêu cầu thì có cặp đúng  nếu không thì có cặp sai, tỷ lệ sai tương đối cho tấn công đã biết trước dựa vào thống kê. o Sau đó có thể tạo ra các khoá cho các vòng theo suy luận sau • Thám mã tuyến tính Đây là một phát hiện mới khác. Nó cũng dùng phương pháp thống kê. Ở đây cần lặp qua các vòng với xác suất giảm, nó được phát triển bởi Matsui và một số người khác vào đầu những năm 90. Cơ sở của phương pháp dựa trên tìm xấp xỉ tuyến tính. Và có nhận định rằng có thể tấn công DES với 247 bản rõ đã biết. Như vậy thám mã tuyến tính vẫn không khả thi trong thực tế. o Tìm xấp xỉ tuyến tính với xác suất p != ½ P[i1,i2,...,ia] (+) C[j1,j2,...,jb] = K[k1,k2,...,kc] trong đó ia, jb, kc là các vị trí bit trong bản rõ, mã, khoá. o Điều kiện trên cho phương trình tuyến tính của các bít khoá. Để nhận được 1 bít khoá sử dụng thuật toán lân cận tuyến tính o Sử dụng một số lớn các phương trình thử nghiệm. Hiệu quả cho bởi |p – 1/2| Trong quá trình tìm hiểu DES người ta đã hệ thống lại các tiêu chuẩn thiết kế DES. Như báo cáo bởi Copperscmith trong [COPP94]: o Có 7 tiêu chuẩn đối với S box được cung cấp để đảm bảo  tính phi tuyến tính  chống tham mã sai phân  Rối loạn tốt o Có 3 tiêu chuẩn cho hoán vị P để tăng độ khuếch tán 46
  • 47. thao tác của DES Mã khối mã các block có kích thước cố định. Chẳng hạn DES mã các block 64 bít với khoá 56 bít Cần phải có cách áp dụng vào thực tế vì các thông tin cần mã có kích thước tùy ý. Trước kia có 4 kiểu thao tác được định nghĩa cho DES theo chuẩn ANSI: ANSI X3.106-1983 Modes of Use. Bây giờ mở rộng thêm có 5 cách cho DES và chuẩn mã nâng cao (AES – Advanced Encryption Standards). Trong đó có kiểu áp dụng cho khối và có kiểu áp dụng cho mã dòng. 1. Sách mật mã điện tử (Electronic Codebook Book - ECB) • 2. Dây chuyền mã khối (Cipher Block Chaining - CBC) • 3. Mã phản hồi ngược (Cipher FeedBack - CFB) 4. Phản hồi ngược đầu ra (Output FeedBack - OFB) 5. Bộ đếm CTR (Counter) (để biết rõ nội dung của từng kiểu thao tác, đọc giả xem thêm giáo trình William Stallings “Cryptography and Network Security: Principles and Practice”) 4.3. Double DES và Triple DES 4.3.1 Double DES Sơ đồ: Mã hóa: ( ) [ ] M DES DES C 1 K 2 K = Giải mã: ( ) [ ] C DES DES M 1 2 K 1 1 K − − = Mặc dù có 56 2 sự lựa chọn cho khóa 1 K và 56 2 sự lựa chọn đối với khóa 2 K . Điều này dẫn tới có 112 2 sự lựa chọn cho cặp khóa ( ) 2 1 K , K nhưng sức mạnh của DES bội hai không lớn tới mức như vậy. 47
  • 48. bội hai có thể bị tấn công bằng cách thám mã từ hai phía theo đề xuất của Diffie – Hellman. Để khắc phục yếu điểm này người ta đã xây dựng TDES với hai khóa 1 K và 2 K như sau: Mã hóa: ( ) [ ] { } M DES DES DES C 1 K 1 2 K 1 K − = Giải mã: ( ) [ ] { } C DES DES DES M 1 1 K 2 K 1 1 K − − = Với TDES việc tìm kiếm vét cạn yêu cầu khoảng 33 112 10 . 1923 , 5 2 = phép tính TDES, bởi vậy trên thực tế khó có thể thám mã thành công. 4.4 Chuẩn mã nâng cao (AES) 4.4.1 Nguồn gốc Rõ ràng cần phải thay thế DES, vì có những tấn công về mặt lý thuyết có thể bẻ được nó. Một số tấn công nghiên cứu thấu đáo khoá đã được trình diễn. Người ta thấy rằng, cần sử dụng Triple DES (sử dụng DES ba lần liên tiếp) cho các ứng dụng đòi hỏi tăng cường bảo mật, nhưng quá trình mã và giải mã chậm, đồng thời với khối dữ liệu nhỏ. Do đó Viện chuẩn quốc gia Hoa kỳ US NIST ra lời kêu gọi tìm kiếm chuẩn mã mới vào năm 1997. Sau đó có 15 đề cử được chấp nhận vào tháng 6 năm 1998. Và được rút gọn còn 5 ứng cử viên vào tháng 6 năm 1999. Đến tháng 10 năm 2000, mã Rijndael được chọn làm chuẩn mã nâng cao và được xuất bản là chuẩn FIPS PUB 197 vào 11/2001. Yêu cầu của AES • Là mã khối đối xứng khoá riêng. 48