Optical character recognition là gì

Optical Character Recognition [OCR]Nhận dạng ký tự [OCR]. Đây là nghĩa tiếng Việt của thuật ngữ Optical Character Recognition [OCR] - một thuật ngữ thuộc nhóm Technology Terms - Công nghệ thông tin.

Độ phổ biến[Factor rating]: 5/10

Quang nhận dạng ký tự [OCR] đề cập đến cả công nghệ và quá trình đọc và chuyển đổi đánh máy, in hoặc các ký tự viết tay thành văn bản máy mã hóa hoặc một cái gì đó mà máy tính có thể thao tác. Nó là một tập hợp con của nhận dạng hình ảnh và được sử dụng rộng rãi như là một hình thức nhập dữ liệu với đầu vào là một số loại in kỷ lục tài liệu hoặc dữ liệu như báo cáo ngân hàng, hóa đơn bán hàng, hộ chiếu, sơ yếu lý lịch và danh thiếp. Tài liệu này được một trong hai quét hoặc một hình ảnh được thực hiện và nó tùy thuộc vào chương trình để nhận ra những nhân vật và đưa ra một đầu ra dưới dạng một tài liệu văn bản.

Xem thêm: Thuật ngữ công nghệ A-Z

Giải thích ý nghĩa

Nhận dạng ký tự quang học là sự công nhận của các nhân vật ngôn ngữ cụ thể bởi một máy tính bằng cách phân tích một hình ảnh, mà đã là máy tính có thể đọc được. Điều này thường được thực hiện bằng cách lấy một hình ảnh của tài liệu đầu tiên bằng cách quét nó hay chụp ảnh kỹ thuật số. Điều này tạo ra một hình ảnh raster tạo thành từ các dữ liệu mà máy tính hiểu được, và thông qua các thuật toán được lập trình đặc biệt, hầu hết trong số đó được sử dụng trong lĩnh vực trí tuệ nhân tạo, máy tính nhận các mô hình trong hình ảnh, và trong trường hợp này các mô hình là các ký tự. Chương trình sau đó sẽ tạo ra hoặc mã ký tự đầu ra, thường ASCII, đó là tương đương với các nhân vật được công nhận từ hình ảnh đầu vào. Hầu hết các chương trình OCR phải được đào tạo để họ trở thành dàng nhận diện ký tự.

What is the Optical Character Recognition [OCR]? - Definition

Optical character recognition [OCR] refers to both the technology and process of reading and converting typed, printed or handwritten characters into machine-encoded text or something that the computer can manipulate. It is a subset of image recognition and is widely used as a form of data entry with the input being some sort of printed document or data record such as bank statements, sales invoices, passports, resumes and business cards. The document is either scanned or a picture is taken and it is up to the program to recognize the characters and give an output in the form of a text document.

Understanding the Optical Character Recognition [OCR]

Optical character recognition is the recognition of language-specific characters by a computer by analyzing an image, which is already computer-readable. This is often done by taking an image of the document first by scanning it or taking a digital picture. This creates a raster image made up of data that the computer understands, and through specifically programmed algorithms, most of which are used in the field of artificial intelligence, the computer recognizes the patterns in the image, and in this case the patterns are characters. The program then creates or outputs character codes, usually ASCII, that are equivalent to the recognized characters from the input image. Most OCR programs must be trained in order for them to become better at recognizing characters.

Thuật ngữ liên quan

  • Artificial Intelligence [AI]
  • Handwriting Recognition [HWR]
  • Gesture Recognition
  • Intelligent Character Recognition [ICR]
  • Scannable Resume
  • Companion Virus
  • Destructive Trojan
  • 3-D Software
  • QuickTime
  • MIDlet

Source: Optical Character Recognition [OCR] là gì? Technology Dictionary - Filegi - Techtopedia - Techterm

Theo nghĩa đen, OCR là viết tắt của Optical Character Recognition [Nhận dạng ký tự quang học]. Đây là một công nghệ phổ biến để nhận dạng văn bản bên trong hình ảnh, chẳng hạn như tài liệu và ảnh được quét. Công nghệ OCR được sử dụng để chuyển đổi hầu như bất kỳ loại hình ảnh nào có chứa văn bản viết [đánh máy, viết tay hoặc in] thành dữ liệu văn bản có thể đọc được bằng máy.

Công nghệ OCR trở nên phổ biến vào đầu những năm 1990 khi cố gắng số hóa các tờ báo lịch sử. Kể từ đó, công nghệ đã trải qua một số cải tiến. Ngày nay, các giải pháp cung cấp độ chính xác OCR gần như hoàn hảo . Các phương pháp nâng cao như Zonal OCR được sử dụng để tự động hóa quy trình làm việc dựa trên tài liệu phức tạp.

Xem thêm: Cách copy chữ từ ảnh trên PC

OCR được sử dụng để làm gì?

Có lẽ trường hợp sử dụng nổi tiếng nhất cho OCR là chuyển đổi tài liệu giấy in thành tài liệu văn bản có thể đọc được bằng máy. Sau khi tài liệu giấy được quét qua xử lý OCR, văn bản của tài liệu có thể được chỉnh sửa bằng các phần mềm xử lý văn bản.

Trước khi có công nghệ OCR, lựa chọn duy nhất để số hóa tài liệu giấy đã in là nhập lại văn bản theo cách thủ công. Điều này không chỉ tốn thời gian mà còn dẫn đến lỗi đánh máy và đánh máy không chính xác.

OCR thường được sử dụng như một công nghệ “ẩn”, cung cấp tính năng cho nhiều hệ thống và dịch vụ nổi tiếng trong cuộc sống hàng ngày của chúng ta. Ít được biết đến, nhưng rất quan trọng, các trường hợp sử dụng cho công nghệ OCR bao gồm tự động nhập dữ liệu, lập chỉ mục tài liệu cho công cụ tìm kiếm, nhận dạng biển số tự động, cũng như hỗ trợ người mù và khiếm thị.

Công nghệ OCR đã được chứng minh là vô cùng hữu ích trong việc số hóa các tờ báo và văn bản lịch sử hiện đã được chuyển đổi thành các định dạng hoàn toàn có thể tìm kiếm được và giúp việc truy cập các văn bản trước đó trở nên dễ dàng và nhanh chóng hơn.

Các ngân hàng có sử dụng OCR không?

Trong thế giới ngày nay, ngân hàng là một trong những tổ chức sử dụng OCR nhiều nhất. Số hóa tài liệu trong lĩnh vực ngân hàng là một tiện ích tuyệt vời. Nhiều ngân hàng sử dụng công nghệ OCR để đạt được an ninh giao dịch và quản lý rủi ro tốt hơn.

Việc sử dụng phần mềm OCR trong ngân hàng cũng có thể quét nhiều tài liệu bảo lãnh viết tay quan trọng của khách hàng như tài liệu vay của họ và hơn thế nữa. Ngoài ra, việc kết hợp phần mềm nhận dạng khuôn mặt với OCR cũng rất đáng chú ý vì nó cung cấp bảo mật hai lớp tại các máy ATM.

Khả năng OCR tự động để nhập dữ liệu mang lại lợi ích như thế nào đối với hoạt động kinh doanh và quy trình làm việc
Các doanh nghiệp sử dụng khả năng OCR để chuyển đổi hình ảnh và PDF [thường có nguồn gốc dưới dạng tài liệu giấy được quét] tiết kiệm thời gian và tài nguyên cần thiết để quản lý dữ liệu không thể tìm kiếm được. Sau khi được chuyển, thông tin văn bản được xử lý OCR có thể được các doanh nghiệp sử dụng dễ dàng và nhanh chóng hơn.

Những lợi ích của công nghệ OCR đối với doanh nghiệp

  • Loại bỏ việc nhập dữ liệu thủ công
  • Tiết kiệm tài nguyên do khả năng xử lý nhiều dữ liệu nhanh hơn và ít tài nguyên hơn
  • Giảm lỗi
  • Phân bổ lại không gian lưu trữ vật lý
  • Cải thiện năng suất
  • Các giải pháp thu thập dữ liệu mạnh mẽ xử lý nhiều định dạng tài liệu và có thể được sử dụng với cả tài liệu điện tử và tài liệu giấy, loại bỏ giấy và giảm việc nhận dạng thủ công và nhập dữ liệu của nội dung tài liệu vào các hệ thống khác.

Bằng cách sử dụng công nghệ OCR trong giải pháp thu thập dữ liệu, các doanh nghiệp có thể:

  • Giảm chi phí
  • Tăng tốc quá trình xử lý dữ liệu
  • Tự động hóa định tuyến tài liệu và xử lý nội dung
  • Tập trung và bảo mật dữ liệu.
  • Cải thiện dịch vụ bằng cách đảm bảo nhân viên có thông tin cập nhật, chính xác nhất khi họ cần.

Công nghệ OCR cơ bản đã xuất hiện từ cuối những năm 1920. Nó trở nên phức tạp hơn nhiều so với những ngày đầu tiên và giờ đây nó có thể chuyển đổi ngay cả những tài liệu phức tạp hàng loạt một cách nhanh chóng và ít lỗi. Khi tài liệu được chuyển đổi từ định dạng ban đầu sang định dạng mới, chúng trông giống hệt như tài liệu gốc với tất cả các định dạng được sao chép chính xác. Vậy OCR là gì? Để tìm hiểu rõ hơn về vấn đề này, bài viết dưới đây của Luật Dương Gia sẽ cung cấp cho bạn đọc nội dung liên quan đến: ” OCR là gì? Số hóa tài liệu, công nghệ nhận dạng chữ OCR”

Tư vấn pháp luật trực tuyến miễn phí qua tổng đài: 1900.6568

1. OCR là gì?

– OCR [Optical Character Recognition] là nhận dạng ký tự quang học hoặc đầu đọc ký tự quang học được hiểu là sự chuyển đổi điện tử hoặc cơ học các hình ảnh của văn bản được đánh máy, viết tay hoặc in thành văn bản được mã hóa bằng máy, cho dù từ tài liệu được quét, ảnh của tài liệu, ảnh cảnh [ví dụ: văn bản trên biển hiệu và biển quảng cáo trong một bức ảnh phong cảnh, biển số xe ô tô …] hoặc từ văn bản phụ đề chồng lên một hình ảnh [ví dụ: từ một chương trình truyền hình]

– Nhận dạng ký tự quang học [OCR] công nghệ là một giải pháp kinh doanh để tự động hóa việc trích xuất dữ liệu từ văn bản in hoặc viết từ tệp tài liệu hoặc hình ảnh được quét và sau đó chuyển đổi văn bản thành dạng máy có thể đọc được để sử dụng cho việc xử lý dữ liệu như chỉnh sửa hoặc tìm kiếm.

Được sử dụng rộng rãi như một hình thức nhập dữ liệu từ các bản ghi dữ liệu giấy in – cho dù là tài liệu hộ chiếu, hóa đơn, bảng sao kê ngân hàng , biên lai máy tính, danh thiếp, thư, bản in dữ liệu tĩnh hoặc bất kỳ tài liệu phù hợp nào – đó là một phương pháp số hóa bản in phổ biến văn bản để chúng có thể được chỉnh sửa điện tử, tìm kiếm, lưu trữ nhỏ gọn hơn, hiển thị trực tuyến và được sử dụng trong các quy trình máy như điện toán nhận thức , dịch máy , [trích xuất] văn bản thành giọng nói , dữ liệu chính và khai thác văn bản . OCR là một lĩnh vực nghiên cứu về nhận dạng mẫu , trí tuệ nhân tạo và thị giác máy tính.

– Nhận dạng ký tự quang học [OCR] cho phép bạn biến hình ảnh được quét thành văn bản để bạn có thể biến tài liệu trên giấy thành tài liệu kỹ thuật số có thể chỉnh sửa, tìm kiếm được. Điều này có thể giúp giảm lượng không gian vật lý cần thiết để lưu trữ tài liệu và có thể cải thiện đáng kể quy trình làm việc liên quan đến các tài liệu đó. Nó làm giảm nguy cơ bị mất hoặc thất lạc tài liệu và trong nhiều trường hợp, nó loại bỏ nhu cầu xử lý tài liệu theo cách thủ công hoặc khóa lại thông tin có thể dẫn đến sai sót. Và nó có thể giảm chi phí xử lý thủ công.

2. Số hóa tài liệu, công nghệ nhận dạng chữ OCR: 

– Các phiên bản OCR đầu tiên cần được đào tạo với hình ảnh của từng ký tự và làm việc trên một phông chữ tại một thời điểm. Các hệ thống tiên tiến có khả năng tạo ra mức độ chính xác nhận dạng cao cho hầu hết các phông chữ hiện nay đã trở nên phổ biến và với sự hỗ trợ cho nhiều loại đầu vào định dạng tệp hình ảnh kỹ thuật số.  Một số hệ thống có khả năng tái tạo đầu ra được định dạng gần giống với trang gốc bao gồm hình ảnh, cột và các thành phần phi văn bản khác.

–  OCR phân tích các kiểu sáng và tối tạo nên các chữ cái và số để biến hình ảnh được quét thành văn bản. Hệ thống OCR cần nhận dạng các ký tự trong các phông chữ khác nhau, vì vậy các quy tắc được áp dụng để giúp hệ thống khớp những gì nó nhìn thấy trong ảnh với các chữ cái hoặc số phù hợp. Trong khi các hệ thống OCR ban đầu được thiết kế để hoạt động với một phông chữ cụ thể, được tạo ra đặc biệt cho mục đích này, một số hệ thống OCR hiện đại thậm chí có thể nhận dạng chữ viết tay của mọi người. Công nghệ này được gọi là nhận dạng ký tự thông minh [ICR].

– Để OCR hoạt động tối ưu, điều quan trọng là bạn phải quét phiên bản tài liệu rõ ràng nhất có thể. Văn bản bị mờ hoặc các dấu trên bản sao có thể tạo ra lỗi. Các chương trình OCR nhận dạng ký tự văn bản theo từng ký tự nhưng kết quả nhanh đến mức tức thời. Bạn có thể kiểm tra lỗi khi bắt đầu hoặc khi kết thúc quá trình và một số chương trình có tính năng phát hiện lỗi tự động.

Xem thêm: Mẫu biên bản bàn giao tài liệu, công việc, tài sản mới nhất năm 2022

– Hiện nay, một ứng dụng phổ biến của công nghệ OCR là tự động chuyển đổi tệp PDF, TIFF hoặc JPG dựa trên hình ảnh thành tệp văn bản mà máy có thể đọc được. Các tệp kỹ thuật số được xử lý OCR, chẳng hạn như biên nhận, hợp đồng, hóa đơn, báo cáo tài chính, v.v., có thể là:

+ Đã tìm kiếm từ một kho lưu trữ lớn để tìm tài liệu chính xác

+ Đã xem, với khả năng tìm kiếm trong mỗi tài liệu

+ Đã chỉnh sửa, khi cần chỉnh sửa

+ Thay thế , với văn bản trích xuất được gửi đến các hệ thống khác

– Khả năng OCR tự động để nhập dữ liệu mang lại lợi ích như thế nào đối với hoạt động kinh doanh và quy trình làm việc: Các doanh nghiệp sử dụng khả năng OCR để chuyển đổi hình ảnh và PDF [thường có nguồn gốc dưới dạng tài liệu giấy được quét] tiết kiệm thời gian và tài nguyên cần thiết để quản lý dữ liệu không thể tìm kiếm được. Sau khi được chuyển, thông tin văn bản được xử lý OCR có thể được các doanh nghiệp sử dụng dễ dàng và nhanh chóng hơn.

– Những lợi ích của công nghệ OCR đối với doanh nghiệp bao gồm:

+ Loại bỏ việc nhập dữ liệu thủ công

Xem thêm: Mẫu đơn trình báo mất giấy tờ, tài liệu, tài sản mới nhất

+ Tiết kiệm tài nguyên do khả năng xử lý nhiều dữ liệu nhanh hơn và ít tài nguyên hơn

+ Giảm lỗi

+ Phân bổ lại không gian lưu trữ vật lý

+ Cải thiện năng suất

– Giá trị và bề rộng của các giải pháp phân loại và thu thập dữ liệu: Khả năng OCR, khả năng trích xuất văn bản in bằng máy từ một hình ảnh kỹ thuật số, chỉ là một khía cạnh của giải pháp thu thập dữ liệu . Dữ liệu có thể được trích xuất từ ​​các tài liệu ở nhiều định dạng khác nhau – văn bản in tay [ICR], hộp kiểm [OMR], mã vạch, v.v.

– Các giải pháp thu thập dữ liệu mạnh mẽ xử lý nhiều định dạng tài liệu và có thể được sử dụng với cả tài liệu điện tử và tài liệu giấy, loại bỏ giấy và giảm việc nhận dạng thủ công và nhập dữ liệu của nội dung tài liệu vào các hệ thống khác.

– Bằng cách sử dụng công nghệ OCR trong giải pháp thu thập dữ liệu, các doanh nghiệp có thể:

+ Giảm chi phí

Xem thêm: Sử dụng giấy tờ, tài liệu giả có phạm tội không? Bị xử phạt như thế nào?

+ Tăng tốc quy trình

+ Tự động hóa định tuyến tài liệu và xử lý nội dung

+ Tập trung và bảo mật dữ liệu [không có hỏa hoạn, đột nhập hoặc tài liệu bị mất trong hầm sau]

+ Cải thiện dịch vụ bằng cách đảm bảo nhân viên có thông tin cập nhật, chính xác nhất khi họ cần

– Các công cụ OCR đã được phát triển thành nhiều loại ứng dụng OCR dành riêng cho miền, chẳng hạn như OCR biên nhận, OCR hóa đơn, kiểm tra OCR, OCR tài liệu thanh toán hợp pháp.

– Chúng có thể được sử dụng cho:

+ Nhập dữ liệu cho các tài liệu kinh doanh, ví dụ: séc , hộ chiếu, hóa đơn, sao kê ngân hàng và biên lai

+ Nhận dạng biển số tự động

+ Ở sân bay, để nhận dạng hộ chiếu và khai thác thông tin

Xem thêm: Tội làm giả và sử dụng con dấu, tài liệu của cơ quan tổ chức

+ Tài liệu bảo hiểm tự động trích xuất thông tin quan trọng

+ Nhận dạng biển báo giao thông

+ Trích xuất thông tin danh thiếp vào danh sách liên hệ

+ Nhanh chóng tạo các phiên bản văn bản của tài liệu in, ví dụ như quét sách cho Project Gutenberg

+ Làm cho hình ảnh điện tử của tài liệu in có thể tìm kiếm được, chẳng hạn như Google Sách

+ Chuyển đổi chữ viết tay trong thời gian thực để điều khiển máy tính [máy tính bút ]

+ Đánh bại các hệ thống chống bot CAPTCHA , mặc dù chúng được thiết kế đặc biệt để ngăn chặn OCR.  Mục đích cũng có thể là để kiểm tra tính mạnh mẽ của hệ thống chống bot CAPTCHA.

+ Công nghệ hỗ trợ cho người mù và người khiếm thị

Xem thêm: Tài liệu chứng minh tư cách hợp lệ của nhà thầu

+ Viết hướng dẫn cho xe bằng cách xác định hình ảnh CAD trong cơ sở dữ liệu phù hợp với thiết kế xe khi nó thay đổi theo thời gian thực.

+ Làm cho các tài liệu đã quét có thể tìm kiếm được bằng cách chuyển đổi chúng thành các tệp PDF có thể tìm kiếm được

– Ba bước cơ bản của nhận dạng ký tự quang học: xử lý trước hình ảnh; nhận dạng ký tự; và xử lý hậu kỳ của đầu ra.

+ Bước 1: Xử lý trước hình ảnh trong OCR: Phần mềm OCR thường xử lý trước hình ảnh để cải thiện cơ hội nhận dạng thành công. Mục đích của xử lý trước hình ảnh là cải tiến dữ liệu hình ảnh thực tế. Bằng cách này, các biến dạng không mong muốn được loại bỏ và các tính năng hình ảnh cụ thể được nâng cao. Hai quy trình này rất quan trọng đối với các bước sau.

+ Bước 2: Nhận dạng ký tự trong OCR: Để nhận dạng ký tự thực tế, điều quan trọng là phải hiểu “trích xuất tính năng” là gì. Khi dữ liệu đầu vào quá lớn để được xử lý, chỉ một tập hợp các tính năng được giảm bớt được chọn. Các tính năng được chọn sẽ là những tính năng quan trọng trong khi những tính năng bị nghi ngờ là dư thừa sẽ bị bỏ qua. Bằng cách sử dụng tập dữ liệu đã giảm thay vì tập lớn ban đầu, hiệu suất được tăng lên. Đối với quá trình OCR, điều này rất quan trọng vì thuật toán phải phát hiện các phần hoặc hình dạng cụ thể của luồng hình ảnh hoặc video được số hóa.
+ Bước 3: Xử lý hậu kỳ trong OCR: Xử lý hậu kỳ là một kỹ thuật sửa lỗi khác đảm bảo độ chính xác cao của OCR. Độ chính xác có thể được cải thiện hơn nữa nếu đầu ra bị hạn chế bởi một từ vựng. Bằng cách đó, thuật toán có thể trở lại danh sách các từ được phép xuất hiện trong tài liệu được quét chẳng hạn. OCR không chỉ được sử dụng để xác định các từ thích hợp mà còn có thể đọc số và mã. Điều này rất hữu ích để xác định các chuỗi số và chữ cái dài, chẳng hạn như số sê-ri được sử dụng trong nhiều ngành công nghiệp.

– Để đối phó tốt hơn với các loại OCR đầu vào khác nhau, một số nhà cung cấp đã bắt đầu phát triển các hệ thống OCR cụ thể. Các hệ thống này có thể xử lý các hình ảnh đặc biệt và để cải thiện độ chính xác nhận dạng, hơn thế nữa, chúng đã kết hợp nhiều kỹ thuật tối ưu hóa khác nhau.

– Ví dụ: họ đã sử dụng các quy tắc nghiệp vụ, biểu thức chuẩn hoặc thông tin phong phú có trong hình ảnh màu. Chiến lược kết hợp các kỹ thuật tối ưu hóa khác nhau này được gọi là “OCR hướng ứng dụng” hoặc “OCR tùy chỉnh”. Nó được sử dụng trong các ứng dụng như OCR danh thiếp, OCR hóa đơn và OCR thẻ ID.

Video liên quan

Chủ Đề