lịch bong da

  • Sự đóng góp
  • Thời gian cập nhật 11/10/2021
  • 3 readings
  • Rating 0
  • great
  • Step on

Giới thiệu về lịch bong da

bong da lau

Thiết kế và triển khai nền tảng phát hiện trực tuyến chống giả mạo trang web dựa trên kiến ​​trúc đám mây

  • Sự đóng gópĐầu tư vào nghiên cứu
  • Cập nhật thời gian2015-09-29
  • Đọc867 lần
  • ghi bàn4
  • tuyệt vời44
  • Bước lên0

Lu Hao

(Trung tâm Chứng nhận và Đánh giá An toàn Thông tin Thượng Hải Thượng Hải 200011)

Tóm tắt Giả mạo website là một trong những phương thức tấn công website phổ biến nhất, một khi nó xảy ra sẽ ảnh hưởng nghiêm trọng đến hoạt động của website. Nhắm vào những thiếu sót của công nghệ phát hiện chống giả mạo trang web truyền thống, giải pháp này áp dụng giải pháp thiết kế dựa trên nền tảng đám mây, đồng thời cải tiến khung hệ thống và các công nghệ chính. Thông qua xác minh thực nghiệm, giải pháp này cải thiện độ chính xác và tốc độ phát hiện và nhận dạng. Đồng thời, nhờ kiến ​​trúc đám mây, nó đặc biệt thích hợp cho việc phát hiện các nhóm trang web quy mô lớn. Nền tảng được thiết kế trong bài báo này không chỉ có thể cung cấp các dịch vụ phát hiện giả mạo cho các cổng thông tin của các công ty, doanh nghiệp và cơ quan chính phủ khác nhau mà còn cho các cơ quan chức năng trong ngành và các bộ phận giám sát an ninh thông tin để đạt được sự giám sát liên tục 24 giờ đối với các cổng thông tin của các đơn vị khác nhau trong quyền tài phán.Các lợi ích xã hội tốt.

Mạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa website chống giả mạo, phát hiện trực tuyến, thiết kế kiến ​​trúc đám mây, bảo mật thông tin

doi: 10.3969 / j.issn.1674-7933.2015.05.003

Giới thiệu về tác giả: Lu Hao, nam, sinh năm 1980, đại học, kỹ sư, chủ yếu tham gia và nghiên cứu lĩnh vực: an toàn thông tin, Email: luhao@shtec.org.cn.

0 Lời nói đầu

Các trang web từ lâu đã trở thành một phương thức quan trọng để các cơ quan, tổ chức và doanh nghiệp của chính phủ công bố thông tin và cung cấp các dịch vụ công liên quan, do đó phải đối mặt với nhiều mối đe dọa khác nhau từ Internet. Giả mạo trang web là một trong những phương thức tấn công trang web phổ biến nhất, ám chỉ việc phá hủy hoặc thay đổi nội dung của trang web một cách ác ý, khiến trang web không thể hoạt động bình thường hoặc xuất hiện với nội dung web bất thường do tin tặc chèn vào. Theo thống kê hàng năm do Trung tâm Ứng cứu Khẩn cấp Internet Quốc gia công bố, số lượng trang web bị giả mạo ở nước tôi trong năm 2014 là 36.969, tăng đáng kể 53,8% so với 24.034 vào năm 2013.[1]. Có thể thấy, số lượng website bị giả mạo vẫn ở mức cao và tác hại của việc giả mạo website là rất lớn.

Cách truyền thống là triển khai các sản phẩm chống giả mạo trang web trên máy chủ ứng dụng, nhưng do chi phí cao của các sản phẩm này, việc triển khai trên máy chủ trang web cũng sẽ làm mất hiệu suất máy chủ và thay đổi quy trình xuất bản trang web, gây bất tiện cho người dùng. , vì vậy nó có một số hạn chế nhất định là không thích hợp cho việc triển khai trang web quy mô lớn. Tính năng phát hiện giả mạo trực tuyến có thể phát hiện kịp thời các cuộc tấn công giả mạo trang web mà không làm tăng tải máy chủ, giảm đáng kể tác hại do các cuộc tấn công giả mạo trang web gây ra.

Hiện tại, các phương pháp phát hiện trực tuyến giả mạo trang web phổ biến bao gồm phát hiện thủ công, so sánh ảnh chụp nhanh trang, phát hiện bằng mã Trojan và phát hiện dựa trên công nghệ máy tìm kiếm meta. Phát hiện thủ công là kiểm tra trạng thái trang theo cách thủ công thường xuyên, việc này tốn nhiều công sức và có chu kỳ phát hiện dài. So sánh ảnh chụp nhanh trang là lưu tất cả các trang của trang web được phát hiện theo cách tương tự như công cụ tìm kiếm lấy ảnh chụp nhanh trang, sau đó thiết lập cơ chế thăm dò và so sánh kết quả của mỗi lượt truy cập với ảnh chụp nhanh để xác định xem trang đó đã được bị can thiệp, Hiệu quả phát hiện không cao, không thể phân biệt được trang web được cập nhật hay bị giả mạo, cần phải đánh giá thủ công. Để xác định xem một trang web có bị giả mạo hay không thông qua phát hiện ngựa Trojan, trước tiên bạn phải quét trang web đó để tìm các con ngựa Trojan phổ biến và các chương trình cửa hậu, đồng thời lọc theo kết quả quét và chỉ phát hiện các trang web có ngựa Trojan và cửa hậu của Trung Quốc.Việc phát hiện ra các trang web bị giả mạo dựa trên công nghệ máy tìm kiếm meta là tập hợp nhiều công cụ tìm kiếm, chẳng hạn như Baidu, Google, Yahoo, v.v., để truy vấn các điều kiện tìm kiếm được xây dựng, chẳng hạn như "bị tấn công bởi" làm từ khóa, để xử lý và xác định kết quả và cuối cùng tìm ra trang web bị giả mạo[2]. Công nghệ phát hiện ngựa Trojan và công nghệ dựa trên công cụ tìm kiếm meta chủ yếu được sử dụng để phát hiện các trang web lớn (chẳng hạn như tất cả các trang web trong toàn bộ quốc gia và khu vực), và có một số tình huống báo cáo thấp nhất định và chúng thường chỉ được sử dụng làm phương tiện phụ trợ cho phát hiện chống giả mạo trang web.

Bài viết này tập trung vào những tồn tại của công nghệ phát hiện trực tuyến chống giả mạo trang web nêu trên, kết hợp những ưu điểm của công nghệ hiện có, tập trung nâng cao hiệu quả phát hiện đồng thời đảm bảo tỷ lệ âm tính giả và dương tính giả thấp, đồng thời tiến hành nghiên cứu sơ bộ trong thực tế. .Hãy dùng thử để độc giả tham khảo.

1 Phân tích và thiết kế nền tảng phát hiện trang web

Giải pháp này triển khai nền tảng phát hiện trang web trên nền tảng đám mây. Một mặt, việc phát triển ứng dụng có thể tập trung vào chính hoạt động phát hiện. Sao lưu, mở rộng và đồng bộ hóa dữ liệu, cũng như bảo vệ an ninh, v.v., được xử lý bởi nhiều hơn nền tảng đám mây chuyên nghiệp. Mặt khác, các ứng dụng Internet theo dõi cần phải đủ linh hoạt để giải quyết các nhu cầu đột ngột. Sử dụng các giải pháp đám mây, các phiên bản máy chủ có thể được tạo hoặc ngừng hoạt động nhanh chóng để đáp ứng nhu cầu linh hoạt của điện toán và tiết kiệm chi phí vận hành và bảo trì.

1.1 Thiết kế khung hệ thống

Giải pháp này dựa trên nền tảng đám mây và được chia thành bốn lớp: lớp ứng dụng kinh doanh, lớp ứng dụng quản lý, lớp ứng dụng cơ bản và lớp SaaS. Đồng thời, thư viện URL và thư viện tính năng được trừu tượng hóa để hỗ trợ dữ liệu. Sơ đồ của khung hệ thống thiết kế được thể hiện trong Hình 1.

1.2 Con đường công nghệ

Trong quá trình thực hiện cụ thể, ba công nghệ chính sau đây đã được tập trung vào:

1) Sử dụng thiết kế kiến ​​trúc đám mây để cải thiện tốc độ phát hiện và độ ổn định hoạt động. Giải pháp này sử dụng kiến ​​trúc xử lý dữ liệu phân tán Hadoop và xây dựng nền tảng điện toán phân tán với sự trợ giúp của khung HDFS (Hệ thống tệp phân tán Hadoop) và MapReduce (thuật toán giao thức ánh xạ)[3]. HDFS được sử dụng để quản lý tập trung cơ sở dữ liệu URL, cơ sở dữ liệu tính năng và cơ sở dữ liệu mẫu thử nghiệm của mỗi trang web, cung cấp hỗ trợ dữ liệu cho từng tác vụ thử nghiệm và cũng chuẩn bị cho công việc khai thác dữ liệu tiếp theo. MapReduce chịu trách nhiệm về nền tảng quản lý thống nhất và các nhiệm vụ lập lịch và giám sát giữa mỗi nút phát hiện ảo. Các hoạt động cốt lõi là hoạt động Bản đồ (ánh xạ) và Rút gọn (giao thức). Đầu tiên, theo nhiệm vụ đã đặt, đơn vị quản lý lấy chuỗi URL được phát hiện từ thư viện URL. Đơn vị tác vụ chia chuỗi URL thành nhiều phần dữ liệu trung bình, sau đó thiết lập và kích hoạt một số nút phát hiện theo khối lượng nhiệm vụ . Sau đó, sau khi mỗi nút VPS hoàn thành nhiệm vụ phát hiện, kết quả được bàn giao cho đơn vị tác vụ để sao chép, nhóm, sắp xếp và các hoạt động khác, sau đó thực hiện hoạt động giao thức để tạo thành kết quả phát hiện cuối cùng. Quá trình lập lịch MapReduce cụ thể được hiển thị trong Hình 2.

Kiến trúc này có khả năng mở rộng mạnh mẽ và khả năng chịu lỗi trong khi vẫn có được sức mạnh tính toán cao. Khi một nút bị lỗi hoặc tài nguyên của nút được phát hiện là không đủ, các nút ảo mới có thể nhanh chóng được thêm vào.

2) Tính năng phân loại công nghệ trích xuất giá trị của các trang động

Hiện tại, hầu hết các trang web sử dụng trang động và tất cả việc trích xuất trang từ các trang web phải tuân theo các đặc điểm của trang động.Zeng Weihui đã đề xuất việc sử dụng công cụ thực thi tập lệnh và thuật toán cắt lát dựa trên đối tượng để hiện thực hóa thiết kế của hệ thống trình thu thập thông tin web hỗ trợ AJAX[4]. Trên cơ sở này, giải pháp này phân tích thông báo phản hồi HTTP bằng cách mô phỏng trình duyệt của nút phát hiện, đồng thời phân loại và trích xuất tập hợp các phần tử của trang web, bao gồm: văn bản HTLM, tập lệnh JavaScript, kiểu CSS (văn bản, phông chữ, kiểu dáng) Và các đối tượng trong trang (flash, Applet, v.v.), rồi tạo giá trị tính năng được đặt bằng cách sử dụng hàm băm một chiều để tạo giá trị tính năng độc lập cho từng phần tử.

3) Công nghệ nhận dạng giả mạo trang web

Sau khi phát hiện thay đổi trang, cần xác định xem đó là cập nhật bình thường của trang web hay là hành vi giả mạo độc hại, vì cả hai đều sẽ khiến các yếu tố khác nhau của trang web thay đổi. Kết hợp với việc phân tích hồ sơ trường hợp sự cố bảo mật thực tế về việc giả mạo trang web được hỗ trợ bởi đơn vị công tác của tác giả trong mười năm qua, người ta thấy rằng việc giả mạo trang web độc hại thường có một hoặc nhiều đặc điểm sau: đặc điểm thời gian của sự thay đổi ( liệu nó có xảy ra trong những giờ không làm việc không, sự thay đổi Cho dù khoảng thời gian xảy ra thấp hơn khoảng thời gian trung bình), phần trăm thay đổi đối với các phần tử khác nhau của trang có lớn không, phần văn bản của trang thay đổi sau khi thay đổi có các từ khóa như "crack bởi", và thẻ scr thay đổi. Trên cơ sở đó, bài viết này đề xuất xác định xem thay đổi trang web có phải là hành vi giả mạo hay không dựa trên các đặc điểm của các cuộc tấn công giả mạo trang web. Thuật toán cụ thể như sau:

Thứ nhất, nó được đánh giá xem các điều kiện khác nhau có được thỏa mãn theo giá trị đặc trưng hay không và kết quả của phán đoán là một biến T thuộc kiểu giá trị Boolean. Ví dụ: nếu thời gian thay đổi trang web là trong giờ không phải làm việc, giá trị T của điều kiện thời gian là 1, ngược lại nó là 0. Sau đó cộng dồn tất cả các giá trị trọng số Q tương ứng với điều kiện có giá trị T là 1, và cuối cùng giá trị của biến Cảnh báo là kết quả của việc tích lũy. Cuối cùng, mức độ rủi ro của việc thay đổi trang (cao, trung bình, thấp) được đánh giá theo giá trị cảnh báo.Trong số đó, giá trị Q và ngưỡng đánh giá mức độ cảnh báo của Cảnh báo có thể được điều chỉnh liên tục theo hiệu quả hoạt động thực tế và giá trị Q có thể được chọn thông qua tỷ lệ thu thập thông tin, đặc biệt đối với các loại trang web khác nhau thông qua các thuật toán phân cụm (chẳng hạn như : Thuật toán K-mean, Thuật toán SOM, Thuật toán FCM, v.v.) để phân biệt ngưỡng phán đoán mức cảnh báo của Cảnh báo[5]. Hiện tại, do việc giả mạo trang web là một sự kiện có xác suất nhỏ, việc lấy mẫu rất khó khăn, và mỗi loại đối tượng phát hiện lại có những đặc điểm khác nhau, vì vậy giải pháp này tạm thời sử dụng phương pháp phân công trực tiếp khi kích thước mẫu của nền tảng phát hiện có tích lũy đến một số tiền nhất định, Thuật toán gán được cải thiện một phần.

2 Triển khai nền tảng phát hiện trang web

Giải pháp này triển khai nền tảng phát hiện trang web trên nền tảng đám mây, kết hợp công nghệ ảo hóa để phân bổ tài nguyên giám sát độc lập cho từng đối tượng được giám sát và thực hiện việc lập lịch, giám sát và hỗ trợ dữ liệu của nhiều nút phát hiện ảo thông qua một nền tảng quản lý thống nhất. Giải pháp này cũng thiết kế thêm một lớp giao diện trừu tượng của dịch vụ đám mây để đảm bảo khả năng tương thích với các nền tảng dịch vụ đám mây chính thống bằng cách điều chỉnh lớp này.

Có hai hình thức thuê máy chủ chính được cung cấp bởi các nhà cung cấp đám mây phổ biến: thứ nhất, thuê máy chủ đám mây cố định, không khác nhiều so với thuê máy chủ truyền thống; thứ hai, thuê máy chủ với dịch vụ mở rộng co giãn, người dùng có thể tùy theo nhu cầu kinh doanh và Chiến lược để tự động điều chỉnh các dịch vụ quản lý của nó cho tính toán đàn hồi, nghĩa là tự động tăng các phiên bản máy chủ ảo khi doanh nghiệp phát triển và tự động giảm các phiên bản máy chủ ảo khi hoạt động kinh doanh sa sút[6]. Xét rằng dịch vụ phát hiện giả mạo trang web là một nhiệm vụ định kỳ và tài nguyên máy chủ ảo mới cần được bổ sung liên tục theo sự gia tăng của các đối tượng phát hiện tiếp theo, giải pháp này áp dụng chế độ dịch vụ mở rộng quy mô đàn hồi.

Kết hợp với các đặc điểm của nền tảng đám mây, nền tảng phát hiện giả mạo được thiết kế như một nền tảng quản lý triển khai tập trung và nhiều nút phát hiện ảo triển khai phân tán.

2.1 Nền tảng quản lý

Nền tảng quản lý hợp nhất được thiết kế theo kiến ​​trúc bốn lớp: lớp dịch vụ bên thuê, lớp dịch vụ cơ bản, lớp quản lý tài nguyên và lớp trừu tượng đám mây. Đồng thời, hai cơ sở dữ liệu thư viện tài nguyên, thư viện mẫu và hệ thống con bảo mật ứng dụng được thiết kế như hỗ trợ kinh doanh Xem hình ảnh sơ đồ cấu trúc chức năng 3.

2.2 Nút phát hiện

Máy chủ ảo chủ yếu là một nút phát hiện được ảo hóa và các mô-đun của nó chủ yếu bao gồm: mô-đun lấy trang, mô-đun phân tích trang, mô-đun xử lý giá trị tính năng, mô-đun nhận dạng tấn công và mô-đun giao tiếp. Sơ đồ nguyên lý làm việc của nó được thể hiện như trong hình 4.

Mô-đun thu thập thông tin web sử dụng công nghệ thu thập thông tin web để thu thập thông tin cấu trúc trang web theo URL ban đầu của mục tiêu, đồng thời thu thập dữ liệu URL và mã trang web của trang web. Mô-đun phân tích trang phân loại nội dung được thu thập và trích xuất một bộ sưu tập các phần tử khác nhau của trang web, bao gồm: văn bản HTLM, tập lệnh JavaScript, kiểu CSS (văn bản, phông chữ, kiểu, v.v.), liên kết, đối tượng trong trang (Flash, Applet, v.v.). Mô-đun xử lý giá trị tính năng chịu trách nhiệm tính toán giá trị tóm tắt của kết quả trích xuất trang theo thuật toán MD5 và nhận ra việc tạo ra giá trị tính năng của các phần tử khác nhau của trang web và so sánh giá trị tính năng của trang. Mô-đun nhận dạng cuộc tấn công sẽ thu được kết quả so sánh giá trị đặc trưng, ​​hoàn thành nhiệm vụ nhận dạng cuộc tấn công theo thuật toán nhận dạng cuộc tấn công và tạo ra thông tin cảnh báo. Mô-đun giao tiếp chịu trách nhiệm giao tiếp giữa nút phát hiện và nền tảng quản lý thống nhất, đồng thời hoàn thành việc truyền các hướng dẫn và dữ liệu phát hiện.

3 Kiểm tra hệ thống và phân tích kết quả

Giải pháp này là một nền tảng có thể mở rộng và mở, và một phiên bản thử nghiệm nội bộ đã được hoàn thành. Dựa trên sự phát triển của Java, tất cả các nút và nền tảng quản lý đang chạy trên Ubuntu Server 14.04 (64-bit), cơ sở dữ liệu sử dụng MySQL 5.6.25 và phiên bản JDK là 1.8.45 (64-bit).

Để chứng minh tính hiệu quả của sơ đồ thiết kế của nền tảng, chúng tôi đã tiến hành hai bộ thử nghiệm, được kiểm tra về hiệu suất phát hiện và độ chính xác của phát hiện. Đối tượng kiểm tra được lựa chọn là các cổng thông tin điện tử của 50 đơn vị thuộc một ngành nhất định, trong đó có 3 đơn vị cấp huyện, 12 đơn vị cấp thị xã và 35 đơn vị cấp phố.

3.1 Thử nghiệm 1: Kiểm tra hiệu suất phát hiện

Giải pháp 1: Chọn 6 máy chủ ảo cho thuê, mỗi máy chủ được cấu hình với 4 lõi CPU và bộ nhớ 4GB, băng thông mạng là 100M đỉnh. Một trong số chúng được sử dụng làm thiết bị đầu cuối chính và năm đối tượng được sử dụng làm nút phát hiện. 50 đối tượng phát hiện được phân bổ cho năm hàng đợi theo chiến lược phát hiện trước vào trước. Giải pháp thứ hai là thuê dịch vụ theo yêu cầu để tự động xin tài nguyên độc lập từ nền tảng đám mây để thiết lập máy chủ ảo VPS xử lý song song, sau khi máy chủ ảo hoàn thành nhiệm vụ sẽ tự động đăng xuất và giải phóng tài nguyên.

Kết quả của thử nghiệm được thể hiện trong Bảng 1. Chỉ số tiêu tốn thời gian trung bình của một lần phát hiện trang web tương tự như Sơ đồ 1 và Sơ đồ 2. Xét về các chỉ số thời gian phát hiện tổng thể, mặc dù phương án 1 bật 5 máy chủ cùng lúc để kiểm tra, nhưng tổng thời gian vẫn không thể so sánh với tất cả các nhiệm vụ của phương án 2 cùng lúc, và hiệu quả chênh lệch. là gần 7 lần. Hơn nữa, trong quá trình giải pháp hai, do quy mô lớn của các trang web của ba đơn vị cấp huyện, việc phân bổ thứ cấp các nhiệm vụ phát hiện của các trang web cấp huyện sau khi hoàn thành nhiệm vụ phát hiện nút của các nút khác đã rút ngắn hơn nữa thời gian phát hiện.

3.2 Thí nghiệm 2: Kiểm tra độ chính xác phát hiện

Theo thử nghiệm thứ hai trong thử nghiệm đầu tiên, các trang web của 50 đơn vị được kiểm tra 24 giờ một ngày trong khoảng thời gian 1 giờ, kéo dài 180 ngày và tổng cộng 2,83 triệu trang đã được kiểm tra. trong Bảng 2. Trong số đó, 6 251 thay đổi cấp độ trang đã được phát hiện và số lần được xác định là giả mạo bởi nền tảng là 3 lần. Nếu thủ công, không thể phát hiện 2,83 triệu trang, ngay cả khi các thay đổi trang được tự động phát hiện bằng cách so sánh máy, nếu không sử dụng thuật toán nhận dạng giả mạo, sẽ là một quá trình tẻ nhạt để đánh giá các thay đổi theo cách thủ công. Việc sử dụng thuật toán xác định giả mạo chỉ yêu cầu xem xét thủ công 3 bản ghi với mức độ báo động cơ bản cao hơn và đã được xác minh rằng 3 bản ghi đều là cảnh báo hợp lệ, giúp cải thiện đáng kể hiệu quả phát hiện trang web.

4. Kết luận

Nền tảng phát hiện giả mạo trang web trực tuyến có yêu cầu thiết kế cao và độ khó. Đồng thời, do hạn chế về nguồn lực như kinh nghiệm, kinh phí và nhân lực, bài viết này tập trung vào việc giải quyết vấn đề phát hiện giả mạo trang web dựa trên ứng dụng khách truyền thống và sử dụng nền tảng dịch vụ đám mây để cải thiện hiệu quả phát hiện trang web quy mô lớn. Cố gắng ban đầu. Các thử nghiệm đã xác minh rằng nền tảng phát hiện giả mạo trực tuyến sử dụng ý tưởng điện toán đám mây để cải thiện kết quả phát hiện chính xác và nhanh chóng hơn, đồng thời có giá trị thực tế mạnh mẽ.

Mạng Tạp chí Giáo dục http://www.jyqkw.com
người giới thiệu

[1]Trung tâm Điều phối Công nghệ Khẩn cấp Mạng Máy tính Quốc gia Báo cáo An ninh Mạng Internet Trung Quốc 2014. http://www.cert.org.cn/publish/main/upload/File/2014%20Annual%20Report.pdf.

[2]Zhuge Jianwei, Yuan Chunyang. Phát hiện các trang web bị giả mạo dựa trên trích dẫn metasearch và phân tích điều tra những kẻ tấn công[J]An ninh mạng thông tin, 2009, (10).

[3]Chen Kang, Zheng Weimin. Điện toán đám mây: Ví dụ về hệ thống và tình trạng nghiên cứu[J]Tạp chí Phần mềm, 2009, (5).

[4]Zeng Weihui. Thiết kế và triển khai hệ thống trình thu thập thông tin web hỗ trợ AJAX[D]An Huy: Đại học Khoa học và Công nghệ Trung Quốc, 2009.

[5]Han Hui, Mao Feng, Wang Wenyuan. Sự phát triển mới nhất của thuật toán cây quyết định trong khai thác dữ liệu[J]Nghiên cứu Ứng dụng Máy tính, 2004, (12).

[6]Li Xinqi, Wu Jie. Kiến trúc đám mây đàn hồi dựa trên công nghệ ảo hóa Xen[J]Ứng dụng Hệ thống Máy tính, 2011, (11).

Trước: Lễ hội tiêu thụ thông tin trong nước đầu tiên được tổ chức tại Thượng Hải, Thượng Hải nhằm xây dựng một trung tâm khoa học và công nghệ kỷ nguyên "Internet +"
Kế tiếp: Thiết kế và Hiện thực hóa Hệ thống Đường dây nóng Dịch vụ Khách hàng Một cửa

Chúc các bạn đọc tin lịch bong da vui vẻ!