Trong khi tìm kiếm trên Google, đôi khi chúng tôi gặp phải trường hợp Google buộc chúng tôi chọn hình ảnh dựa trên mô tả. Sau khi chúng tôi chọn đúng hình ảnh, Google cho phép chúng tôi tìm kiếm. Ngoài ra, một số trang khác buộc chúng ta phải chọn hình ảnh giống nhau. Đây là một bài kiểm tra nhằm phân biệt người dùng với các hệ thống tự động khi truy cập một trang web sử dụng recaptcha. Bài viết sau bizfly cloud sẽ giới thiệu việc kiểm tra recaptcha là gì và tại sao người dùng nên thực hiện kiểm tra recaptcha.
Tổng quan về recaptcha là gì?
Dựa trên mã xác minh được phát triển bởi luis von ahn, ben maurer, colin mcmillen, harshad bhujbal, manuel blum.
– Được phát triển bởi Google.
– Phiên bản đầu tiên ngày 27 tháng 3 năm 2007.
– Phiên bản hiện tại là v2, v3 đang được phát triển và bắt đầu.
1. Recaptcha v1 là gì
Đầu tiên, recaptcha là công nghệ dựa trên hệ thống captcha . CAPTCHA là viết tắt của “ kiểm tra Turing công khai hoàn toàn tự động để phân biệt máy tính với con người “. Tóm lại, tên hệ thống tương đối dài, nó được dùng để xác định xem truy cập là từ người dùng hay là một bài kiểm tra do máy tính tự động tạo ra.
Bài kiểm tra Turing chỉ đơn giản là bài kiểm tra phân biệt con người với máy tính bằng một số hình thức kiểm tra.
captcha đôi khi được gọi là thử nghiệm điều chỉnh ngược vì hình ảnh xác thực có đối tượng thử nghiệm là con người (để xác định xem đó có phải là con người hay không) và biểu đồ kiểm tra tâm linh sử dụng máy tính làm đối tượng thử nghiệm (để đánh giá nó có phải là máy tính hay không), mặc dù đối với cả hai bài kiểm tra, cả con người và máy tính đều là những người tham gia thử nghiệm.
Captcha được thiết kế dựa trên một số khác biệt giữa nhận thức của con người về thông tin và máy tính. Ví dụ, trước đây, con người có thể đọc văn bản trên hình ảnh là chuyện bình thường, nhưng đối với máy tính thì rất khó.
recaptcha được phát triển bởi google và được sử dụng miễn phí. Mục đích của recaptcha ban đầu là để giúp các trang web ngăn chặn thư rác: một máy tính được lập trình sẵn gửi một số lượng lớn các yêu cầu cho một mục đích (mà con người bình thường không thể gửi trong một khoảng thời gian ngắn). …) ảnh hưởng đến hoạt động của máy chủ web.
Giống như hộp recaptcha trong hình trên, hộp màu đỏ, chúng ta có thể đọc văn bản được viết là “phân cấp độ”. Nhưng với các hệ thống tự động được lập trình sẵn, việc “đọc” sẽ gặp khó khăn vì máy tính không giống con người, khi hầu hết người dùng đã quen đọc từ bằng mắt và ghi nhớ chúng trong não.
Dưới mỗi khung recaptcha, có một trường nhập liệu để chúng ta nhập các từ được hiển thị ở trên. Nếu đúng, người nhập sẽ được đánh giá là vượt qua bài kiểm tra (hoặc là một con người), nếu sai, người dùng sẽ phải thử lại với một hình ảnh khác.
Trong v1, recaptcha chủ yếu cung cấp các bài kiểm tra yêu cầu người dùng đọc và điền văn bản trên hình ảnh. Những hình ảnh văn bản này được quét từ sách giấy và sau đó được xử lý trước để tạo ra những hình ảnh như trong tranh. Điều này đã giúp nhiều sách và báo như New York Times và Google Books được lưu trữ kỹ thuật số.
Cũng chính từ đây, “cuộc chiến” xoay quanh recaptcha đã nổ ra, dẫn đến những thay đổi trong recaptcha, sự tham gia của nhiều bên và các công nghệ liên quan:
phe recaptcha: Phiên bản đầu tiên của recaptcha v1 là một tập lệnh được quét từ sách, báo và có cùng phông chữ và phông chữ như khi in ra và quét. Các ký tự được chọn qua ocr ( Nhận dạng ký tự quang học )
Nhận dạng ký tự quang học (ocr) là một công nghệ được sử dụng để chuyển đổi văn bản trên hình ảnh thành các ký tự được lưu trữ trên máy tính.
Giả vờ là máy tính của người dùng: Sử dụng chính công nghệ ocr, nhưng với thuật toán tốt hơn để tạo ra một chương trình dễ nhận biết hơn chương trình đã tạo recaptcha.
phe recaptcha: Thêm độ khó cho các chữ cái và ký tự theo nhiều cách: làm mờ ký tự, làm biến dạng văn bản, gạch ngang, tạo các màu nền khác nhau trong một từ, văn bản viết tay …
Máy tính giả danh người dùng: Tiếp tục nâng cấp ocr, có thể giải quyết nhiều ảnh recaptcha. Ví dụ: chương trình được xuất bản bởi claudia cruz, fernando uceda và leobardo reyes vào ngày 27/2/2012 tuyên bố có thể giải với độ chính xác 82%
Mạo danh người dùng: Captcha Farming, hoạt động sử dụng người khác để thay mặt người dùng giải quyết hệ thống captcha. Bởi vì người kiểm tra bài kiểm tra là một con người, anh ta có thể dễ dàng vượt qua bài kiểm tra. Những người giải quyết được captcha gia đình này được gọi là nông dân captcha.
Nông dân CAPTCHA được coi là những người “tham gia” bài kiểm tra CAPTCHA.
phe recaptcha: Sử dụng các biện pháp như chặn ip, nhận dạng máy tính và duyệt dữ liệu có thể nhận dạng hoặc cái gọi là lấy dấu vân tay trình duyệt để ngăn chặn việc sử dụng mã xác minh, …
Nhiều năm sau, việc lấy lại mã nhận dạng chữ viết tay đã trở nên khó khăn đến nỗi cả máy tính và người dùng đều không thể giải quyết được. Cuối cùng, vào ngày 31 tháng 3 năm 2018, Google đã thông báo kết thúc recaptcha v1, hay viết tắt là recaptcha, được thay thế bằng recaptcha v2.
2. Xem lại v2 và v3
recaptcha v2 sẽ sử dụng hình ảnh thay vì hình ảnh văn bản và yêu cầu người dùng chọn hộp hình ảnh có mô tả, ví dụ: chọn hình ảnh có chứa đường kẻ, chọn hộp hình ảnh có chứa ký tên, v.v. , nhưng trước tiên một hộp kiểm có nội dung “Tôi không phải là người máy” sẽ xuất hiện.
Khi người dùng tích vào, Google sẽ phân tích thông tin của người vừa gửi yêu cầu theo nhiều cách khác nhau, chẳng hạn như: đăng nhập tài khoản Google, cookie của trình duyệt, lịch sử duyệt web … Nếu đánh giá của người dùng Google. cho rằng người dùng không được lập trình sẵn chương trình, người dùng không phải chọn ảnh mà vượt qua bài kiểm tra.
Với recaptcha v1 và v2, người dùng có thể chọn nghe âm thanh thay vì nhận dạng hình ảnh. Trong v1, chúng tôi nhấp vào hình ảnh của loa và trong v2, chúng tôi nhấp vào hình ảnh của tai nghe. Lúc này, recaptcha sẽ gửi một đoạn âm thanh (thường là đoạn ghi âm của một số hoặc một số từ đang được đọc to), người nghe phải nghe và điền từ họ nghe được, sau đó nhấn OK.
Phiên bản 3 cải tiến trên v2 và không còn yêu cầu người dùng nhận dạng hình ảnh hoặc âm thanh. Google sẽ đánh giá từng người dùng từ 0 đến 1. Thang điểm sẽ tăng hoặc giảm tùy thuộc vào cách người dùng duyệt web. Nếu điểm người dùng giảm xuống 0, người dùng là một chương trình được lập trình trước, nếu là 1, người dùng là một con người. Tất cả các hoạt động kiểm tra này sẽ chạy ở chế độ nền và người dùng sẽ không nhìn thấy. Điều này sẽ làm giảm sự khó chịu của các phiên bản recaptcha trước đó.