Menangani ratusan kontrak adalah tugas yang menegangkan dan membosankan. Anda perlu membaca semua klausa secara menyeluruh dan memastikan semuanya selaras dengan kebijakan Anda. Setelah Anda melewatkan klausa, itu bisa menyebabkan masalah besar.

Mengapa Menggunakan Otomatisasi untuk Mengekstrak Syarat dan Klausul Kontrak?

Tidak ada sistem yang dapat menangani data berkualitas buruk ketika kualitas Optical Character Recognition (OCR) (proses mengubah file gambar atau dokumen kertas menjadi media yang dapat dibaca komputer dan dicari) mempengaruhi semua karakteristik kritis.

Beberapa perusahaan mengatakan bahwa pembelajaran mesin dan/atau pengkodean prediktif dapat menggantikan kualitas OCR. Hal ini tidak terjadi sama sekali.

Beberapa kesalahan OCR dapat diperhitungkan pada sistem apa pun, tetapi, pada kenyataannya, sistem dengan ketelitian tinggi membutuhkan data bersih sebanyak mungkin. Kami tidak bermaksud “bahwa pembelajaran mesin … dapat mengimbangi kualitas OCR” (meskipun kami pikir itu mungkin), tetapi lebih bahwa sistem ekstraksi metadata kontrak berbasis pembelajaran mesin sering dapat mengidentifikasi klausa dalam pemindaian berkualitas rendah.

Meskipun banyak kata yang diubah selama proses OCR. Kami setuju bahwa pemindaian bersih lebih disukai. Tetapi saat melihat kontrak, Anda sering menemukan pindaian berkualitas rendah, dan kontrak harus dilihat dalam bentuk apa pun.

Baca Juga: 6 Pertanyaan Tentang OCR (Optical Character Recognition)

Ada alasan teoretis yang meyakinkan mengapa sistem pembelajaran mesin harus mengungguli mesin pencari dalam memberikan kata kunci dan kontrak basis data saat merayapi kualitas rendah (dan secara umum). Sebuah studi akademis baru-baru ini “menunjukkan bahwa pembelajaran mesin statistik adalah pendekatan terbaik untuk memecahkan masalah ekstraksi informasi.”

Namun, karena banyak pos bantuan sebelumnya telah menjelaskan pro dan kontra dari kata kunci (lihat juga contoh analisis kata kunci di sini), membandingkan dan meninjau konvensi pembelajaran mesin, kami pikir mungkin lebih membantu untuk menunjukkan bagaimana kinerja sistem kami pada perayapan rendah. kualitas yang belum terlatih.

Baca Juga: Apa Itu Machine Learning dan Semua Hal Yang Perlu Anda Mengerti

Bagaimana Mengekstrak Ketentuan Kontrak Menggunakan OCR?

Untuk menjelaskan dengan tepat mengapa pemindaian berkualitas rendah dapat menjadi masalah bagi perangkat lunak abstraksi kontrak, penting untuk terlebih dahulu menjelaskan kesesuaian perangkat lunak OCR. Lihat bagaimana bot kami mengekstrak dokumen kontrak menggunakan OCR dan Pembelajaran Mesin:

Perangkat lunak ekstraksi metadata kontrak seperti milik kami bekerja dengan menerapkan templat pengiriman kontrak ke teks. Jika file gambar (seperti gambar pindaian) dimuat, sistem harus mengubah gambar pindaian menjadi teks.

Perangkat lunak Optical Character Recognition (“OCR”) melakukan konversi gambar menjadi teks ini. Vendor perangkat lunak validasi kontrak seperti kami biasanya (mungkin secara eksklusif, tetapi saya tidak dapat mengatakan dengan pasti) mengintegrasikan OCR terintegrasi pihak ketiga ke dalam sistem mereka untuk fungsi ini (terkadang dengan modifikasi OCR).

Setelah mengonversi dokumen menjadi teks, sistem ekstraksi metadata kontrak dapat menerapkan templat ekstraksi klausanya ke teks dan mencatat hasilnya sesuai dengan itu. Keakuratan OCR dapat diturunkan oleh pemindaian berkualitas buruk, dan ada banyak pemindaian berkualitas buruk dalam ikhtisar kontrak.

Ini berarti bahwa templat ekstraksi klausa sering kali harus digunakan untuk teks, sebagai lawan dari apa pun yang secara eksplisit dibuat untuk itu.


Baca artikel ini dalam: Bahasa Inggris

By: Elsa Ajarwati