วิธีแปลงรูปภาพเป็นข้อความ (OCR ฟรี ไม่ต้องอัปโหลด)

เลิกพิมพ์ข้อความที่ติดอยู่ในภาพหน้าจอ รูปถ่าย หรือไฟล์สแกนใหม่ทีละตัวได้แล้ว นี่คือวิธีดึงคำออกจากรูปภาพใด ๆ ด้วย OCR อย่างแม่นยำ รองรับ 12 ภาษา และทำงานทั้งหมดภายในเบราว์เซอร์ของคุณ

อัปเดตเมื่อ 25 มิถุนายน 2569

เลิกพิมพ์ข้อความจากรูปภาพใหม่ได้แล้ว

คุณมีภาพหน้าจอของที่อยู่ รูปถ่ายใบเสร็จ หรือหน้าที่สแกนมา และสิ่งเดียวที่คุณต้องการจริง ๆ คือข้อความในนั้น หากไม่มี OCR ทางเลือกเดียวคือการเพ่งมองรูปภาพแล้วพิมพ์ทุกคำใหม่ด้วยมือ ซึ่งช้าและผิดพลาดง่ายกับตัวเลขยาว ๆ หรือคำสะกดที่ไม่คุ้นเคย

การรู้จำอักขระด้วยแสง (OCR) ทำงานนั้นแทนคุณ ลากรูปภาพวางลงไป แล้วมันจะอ่านอักขระออกมาเป็นข้อความที่แก้ไขได้ ซึ่งคุณคัดลอก ค้นหา และวางที่ใดก็ได้ ไม่ต้องพิมพ์ใหม่ ไม่ต้องใช้บริการถอดข้อความ และไม่ต้องมีบัญชี

OCR ทำอะไรกันแน่

OCR หรือการรู้จำอักขระด้วยแสง เปลี่ยน รูปภาพ ของข้อความให้เป็นข้อความ จริง ไม่ว่าจะแบบไหนหน้าจอของคุณก็แสดงตัวอักษร แต่สำหรับคอมพิวเตอร์ รูปภาพเป็นเพียงพิกเซลสี คำต่าง ๆ จะเลือกหรือค้นหาไม่ได้จนกว่าจะมีบางอย่างมารู้จำรูปทรงเหล่านั้นเป็นตัวอักษร OCR คือขั้นตอนนั้น มันค้นหาบริเวณข้อความในรูปภาพ จับคู่รูปทรงกับชุดอักขระของภาษาหนึ่ง แล้วให้ออกมาเป็นสายอักขระที่คุณแก้ไขได้

นี่คือเทคโนโลยีเดียวกับเบื้องหลังฟีเจอร์ "เลือกข้อความในรูปถ่าย" การค้นหาเอกสารสแกน และการแปลงหนังสือเก่าเป็นดิจิทัล เครื่องมือ OCR รู้จำข้อความจะใช้สิ่งนี้กับรูปภาพใด ๆ ที่คุณให้ ไม่ว่าจะเป็น PNG, JPG, ภาพหน้าจอ หรือรูปถ่าย แล้วคืนคำพร้อมคะแนนความเชื่อมั่น เพื่อให้คุณรู้ว่ามันมั่นใจแค่ไหน

สามขั้นตอนในการดึงข้อความจากรูปภาพ

เปิดรูปภาพ ลากภาพหน้าจอ รูปถ่าย หรือไฟล์สแกนของคุณวางลงในเครื่องมือ OCR รู้จำข้อความ รูปถูกอ่านในเครื่อง จึงไม่มีการอัปโหลดเลย แม้แต่ก่อนที่การรู้จำจะเริ่มต้น
เลือกภาษาแล้วรู้จำ เลือกภาษาของข้อความในรูปเพื่อให้เอนจินโหลดชุดอักขระที่ถูกต้อง จากนั้นคลิก รู้จำข้อความ เครื่องมือจะสแกนรูปภาพ แล้วคืนคำที่ดึงออกมาพร้อมคะแนนความเชื่อมั่นที่สะท้อนว่าการอ่านสะอาดเพียงใด
คัดลอกข้อความ นำข้อความที่รู้จำได้ไปวางในเอกสาร อีเมล สเปรดชีต หรือบันทึกของคุณ นั่นคือทั้งกระบวนการ ไม่มีขั้นตอนการส่งออก ไม่มีลายน้ำ ไม่ต้องลงชื่อเข้าใช้

การรันครั้งแรกของแต่ละภาษาจะดาวน์โหลดโมเดลของภาษานั้นเพียงครั้งเดียว หลังจากนั้นการรู้จำจะรวดเร็วและทำงานได้แม้ออฟไลน์

วิธีให้ได้ผลลัพธ์ที่สะอาดและแม่นยำ

ความแม่นยำของ OCR ส่วนใหญ่อยู่ที่รูปภาพที่คุณป้อนเข้าไป ไม่ใช่ที่ตัวเครื่องมือ นิสัยเพียงไม่กี่อย่างสร้างความแตกต่างได้มาก

ใช้รูปภาพที่คมชัดที่สุดเท่าที่คุณมี ความละเอียดสูงขึ้นหมายถึงรูปทรงตัวอักษรที่ชัดเจนขึ้น ภาพหน้าจอโดยตรงดีกว่ารูปถ่ายหน้าจอ และการสแกนแบบแท่นราบดีกว่าการถ่ายด้วยมือ
เพิ่มคอนทราสต์ให้มากที่สุด ตัวอักษรสีเข้มบนพื้นหลังสว่างอ่านได้ดีที่สุด หลีกเลี่ยงแสงสะท้อน เงา และพื้นหลังที่รกอยู่ด้านหลังข้อความ
จัดให้ตรง ครอบตัดให้เหลือเฉพาะข้อความ และหมุนให้บรรทัดอยู่ในแนวนอน ข้อความที่เอียงหรือหมุนทำให้การรู้จำสะดุด
เลือกภาษาให้ตรง การเลือกภาษาผิดบังคับให้เอนจินเดาด้วยชุดอักขระที่ผิด เรื่องนี้สำคัญที่สุดสำหรับอักษรที่ไม่ใช่ละติน

ข้อความพิมพ์ถูกรู้จำได้น่าเชื่อถือกว่าลายมือเขียนมาก หากผลลัพธ์ออกมายุ่งเหยิง โดยทั่วไปรูปเดิมในเวอร์ชันที่สะอาดและคอนทราสต์สูงกว่ามักแก้ปัญหาได้

เครื่องมือนี้ครอบคลุมสิบสองภาษาในหลายระบบการเขียน ได้แก่ อังกฤษ จีนตัวย่อ จีนตัวเต็ม ญี่ปุ่น เกาหลี สเปน ฝรั่งเศส เยอรมัน โปรตุเกส อาหรับ รัสเซีย และฮินดี จึงรองรับข้อความอักษรละติน CJK อาหรับ ซีริลลิก และเทวนาครี ไม่ใช่แค่ภาษาอังกฤษ

ทำไมต้องรัน OCR ในเบราว์เซอร์ของคุณ

รูปภาพที่คุณอยากแปลงเป็นข้อความมากที่สุดมักเป็นรูปที่ส่วนตัวที่สุด เช่น บัตรประจำตัวที่สแกน สลิปเงินเดือน จดหมายทางการแพทย์ ใบเสร็จที่มีเลขบัตรของคุณ ภาพหน้าจอแชตส่วนตัว การอัปโหลดสิ่งเหล่านั้นไปยังบริการ OCR บนคลาวด์หมายถึงการมอบต้นฉบับให้เซิร์ฟเวอร์ที่คุณควบคุมไม่ได้

เครื่องมือที่ทำงานบนเบราว์เซอร์หลีกเลี่ยงเรื่องนั้นได้ทั้งหมด การรู้จำทำงานบน tesseract.js ซึ่งเป็นเอนจิน OCR แบบ WebAssembly ที่ทำงานภายในหน้าเว็บ โมเดลภาษาถูกดาวน์โหลดเพียงครั้งเดียวแล้วแคชไว้ และรูปภาพของคุณถูกประมวลผลบนอุปกรณ์ของคุณเอง ไม่มีอะไรถูกส่งระหว่างการรู้จำ และเมื่อโมเดลถูกแคชแล้วก็ยังทำงานได้แบบออฟไลน์ ตรรกะด้านความเป็นส่วนตัวเดียวกันนี้ดำเนินไปตลอดขั้นตอนที่เหลือของงานเอกสาร ดึงข้อความออกจากรูปภาพ จากนั้นจาก PDF แล้วจัดให้เรียบร้อย ถ้าไฟล์ไม่เคยออกจากเครื่องของคุณ ก็ไม่มีอะไรให้รั่วไหล

เช็กลิสต์ฉบับย่อ

ลากรูปภาพวางลงในเครื่องมือ อ่านในเครื่อง ไม่ต้องอัปโหลด
ใช้เวอร์ชันที่คมชัดและคอนทราสต์สูงที่สุดเท่าที่คุณมี
เลือกภาษาให้ตรงกับข้อความก่อนรู้จำ
คลิก รู้จำข้อความ แล้วตรวจดูคะแนนความเชื่อมั่น
คัดลอกผลลัพธ์ และจำไว้ว่าทุกอย่างเกิดขึ้นบนอุปกรณ์ของคุณ

ขั้นตอนแบบรวดเร็ว

1เปิดเครื่องมือ OCR รู้จำข้อความ แล้วลากรูปภาพของคุณวางลงไป ไม่มีการอัปโหลดใด ๆ เพราะรูปภาพถูกอ่านในเครื่องภายในเบราว์เซอร์ของคุณ
2เลือกภาษาของข้อความในรูปภาพ จากนั้นคลิก รู้จำข้อความ เครื่องมือจะสแกนรูปภาพ แล้วคืนคำที่อ่านได้พร้อมคะแนนความเชื่อมั่น
3คัดลอกข้อความที่ดึงออกมา แล้ววางในที่ที่คุณต้องการ รูปภาพจะไม่ออกจากอุปกรณ์ของคุณเลย ดังนั้นแม้แต่ภาพหน้าจอของเอกสารส่วนตัวก็ยังคงอยู่บนเครื่องของคุณ

คำถามที่พบบ่อย

OCR ทำงานได้ดีที่สุดกับรูปภาพข้อความพิมพ์ที่ชัดและคอนทราสต์สูง เช่น ภาพหน้าจอ เอกสารสแกน ใบเสร็จ หน้าหนังสือ สไลด์ และรูปถ่ายป้ายหรือฉลาก รูปที่คมชัด แสงเพียงพอ ตัวอักษรตรง สีเข้มบนพื้นหลังสว่าง จะให้ผลแม่นยำที่สุด ส่วนฟอนต์ตกแต่ง ความละเอียดต่ำ แสงสะท้อน และลายมือเขียนนั้นยากกว่า และอาจต้องใช้รูปที่สะอาดกว่า

สิบสองภาษาในหลายระบบการเขียน ได้แก่ อังกฤษ จีนตัวย่อ จีนตัวเต็ม ญี่ปุ่น เกาหลี สเปน ฝรั่งเศส เยอรมัน โปรตุเกส อาหรับ รัสเซีย และฮินดี โปรดเลือกภาษาให้ตรงกับ ข้อความในรูปก่อนเริ่มรู้จำ เพื่อให้เอนจินใช้ชุดอักขระที่ถูกต้อง

ความแม่นยำขึ้นอยู่กับรูปภาพแทบทั้งหมด ไฟล์สแกนข้อความพิมพ์ที่คมชัดจะถูกรู้จำได้ อย่างน่าเชื่อถือมาก ส่วนรูปถ่ายจากมือถือที่เบลอหรือใบเสร็จที่สีจาง จะยากกว่า เครื่องมือจะแสดงคะแนนความเชื่อมั่นในแต่ละผลลัพธ์ และคุณสามารถเพิ่มความแม่นยำได้เสมอ ด้วยการใช้รูปที่คมชัดและคอนทราสต์สูงขึ้น

ไม่ การรู้จำทำงานบน tesseract.js ซึ่งเป็นเอนจิน OCR แบบ WebAssembly ที่ทำงานภายในเบราว์เซอร์ของคุณ โมเดลภาษาจะถูกดาวน์โหลดเพียงครั้งเดียวแล้วแคชไว้ และรูปภาพของคุณถูกประมวลผลในเครื่อง ไม่มีอะไรถูกส่งไปยังเซิร์ฟเวอร์ ดังนั้นเอกสาร ส่วนตัวอย่างบัตรประจำตัว ใบเสร็จ และเอกสารทางการแพทย์หรือการเงินจึงคงอยู่บนอุปกรณ์ของคุณ

เครื่องมือที่ใช้ในคู่มือนี้

OCR รู้จำข้อความ

ดึงข้อความจากรูปภาพโดยใช้การรู้จำอักขระด้วยแสง

แยกข้อความจาก PDF

แยกเนื้อหาข้อความทั้งหมดจากเอกสาร PDF

ตัวนับคำ

นับคำ ตัวอักษร ประโยค และย่อหน้าในข้อความของคุณทันที