छवि को टेक्स्ट में कैसे बदलें (मुफ़्त OCR, बिना अपलोड)
स्क्रीनशॉट, फ़ोटो या स्कैन में फँसे टेक्स्ट को दोबारा टाइप करना बंद करें। यहाँ जानिए किसी भी छवि से शब्द निकालने का तरीका OCR के साथ — सटीकता से, 12 भाषाओं में, और पूरी तरह आपके ब्राउज़र में।
25 जून 2026 को अपडेट किया गया
किसी तस्वीर से टेक्स्ट दोबारा टाइप करना बंद करें
आपके पास किसी पते का स्क्रीनशॉट, किसी रसीद की फ़ोटो, या कोई स्कैन किया पन्ना है — और जो एक चीज़ आपको असल में चाहिए वह है उसके अंदर का टेक्स्ट। OCR के बिना, एकमात्र विकल्प यही है कि छवि को आँखें सिकोड़कर देखें और हर शब्द हाथ से दोबारा टाइप करें, जो धीमा है और लंबे अंकों या अनजान वर्तनी में आसानी से गलत हो जाता है।
ऑप्टिकल कैरेक्टर रिकग्निशन यह काम आपके लिए कर देता है। एक छवि डालिए, और यह वर्णों को संपादन योग्य टेक्स्ट के रूप में पढ़ देता है जिसे आप कॉपी, खोज और कहीं भी चिपका सकते हैं। न दोबारा टाइप करना, न ट्रांसक्रिप्शन सेवा, और न ही कोई खाता।
OCR असल में क्या करता है
OCR — ऑप्टिकल कैरेक्टर रिकग्निशन — टेक्स्ट की तस्वीर को असली टेक्स्ट में बदलता है। आपकी स्क्रीन दोनों तरह से अक्षर दिखाती है, लेकिन कंप्यूटर के लिए एक छवि केवल रंगीन पिक्सेल होती है; जब तक कुछ आकृतियों को वर्णों के रूप में नहीं पहचान लेता, शब्द न तो चुने जा सकते हैं और न खोजे जा सकते हैं। OCR वही कदम है: यह छवि में टेक्स्ट वाले क्षेत्रों को ढूँढता है, आकृतियों को किसी भाषा के वर्ण समूह से मिलाता है, और एक ऐसी स्ट्रिंग देता है जिसे आप संपादित कर सकते हैं।
यह वही तकनीक है जो "फ़ोटो में टेक्स्ट चुनें" सुविधाओं, स्कैन-दस्तावेज़ खोज, और पुरानी किताबों के डिजिटलीकरण के पीछे है। OCR टेक्स्ट पहचान टूल इसे आपकी दी गई किसी भी छवि पर चलाता है — एक PNG, JPG, स्क्रीनशॉट या फ़ोटो — और शब्द लौटाता है साथ ही एक विश्वास स्कोर ताकि आपको पता चले कि वह कितना निश्चित है।
किसी छवि से टेक्स्ट निकालने के तीन कदम
- छवि खोलें। अपने स्क्रीनशॉट, फ़ोटो या स्कैन को OCR टेक्स्ट पहचान टूल में डालें। इसे स्थानीय रूप से पढ़ा जाता है, इसलिए तस्वीर कभी अपलोड नहीं होती — पहचान शुरू होने से पहले भी नहीं।
- भाषा चुनें और पहचानें। छवि में टेक्स्ट की भाषा चुनें ताकि इंजन सही वर्ण समूह लोड करे, फिर टेक्स्ट पहचानें पर क्लिक करें। टूल छवि को स्कैन करता है और निकाले गए शब्द लौटाता है, साथ ही एक विश्वास स्कोर जो दर्शाता है कि पठन कितना साफ़ रहा।
- टेक्स्ट कॉपी करें। पहचाने गए टेक्स्ट को लें और अपने दस्तावेज़, ईमेल, स्प्रेडशीट या नोट्स में चिपकाएँ। बस यही पूरा चक्र है — न कोई निर्यात कदम, न वॉटरमार्क, न साइन-इन।
किसी दी गई भाषा के लिए पहली बार चलाने पर उसका मॉडल एक बार डाउनलोड होता है; उसके बाद पहचान तेज़ होती है और ऑफ़लाइन भी काम करती है।
साफ़ और सटीक परिणाम कैसे पाएँ
OCR की सटीकता ज़्यादातर उस छवि पर निर्भर करती है जो आप देते हैं, टूल पर नहीं। कुछ आदतें बड़ा फ़र्क डालती हैं:
- जो सबसे तेज़ छवि हो उसका उपयोग करें। अधिक रिज़ॉल्यूशन का मतलब है साफ़ वर्ण आकृतियाँ। सीधा स्क्रीनशॉट किसी स्क्रीन की फ़ोटो से बेहतर है; फ़्लैटबेड स्कैन हाथ से ली तस्वीर से बेहतर है।
- कंट्रास्ट अधिकतम करें। हल्के पृष्ठभूमि पर गहरा टेक्स्ट सबसे अच्छा पढ़ा जाता है। टेक्स्ट के पीछे चमक, छाया और व्यस्त पृष्ठभूमि से बचें।
- सीधा करें। टेक्स्ट तक काटें और घुमाएँ ताकि पंक्तियाँ क्षैतिज हों — टेढ़ा या घुमा हुआ टेक्स्ट पहचान में अड़चन डालता है।
- भाषा मिलाएँ। ग़लत भाषा चुनना इंजन को ग़लत वर्ण समूह से अनुमान लगाने पर मजबूर करता है। यह ग़ैर-लैटिन लिपियों के लिए सबसे ज़्यादा मायने रखता है।
मुद्रित टेक्स्ट हस्तलेखन की तुलना में कहीं अधिक भरोसेमंद ढंग से पहचाना जाता है। यदि कोई परिणाम गड़बड़ आता है, तो उसी छवि का साफ़, अधिक-कंट्रास्ट वाला संस्करण आमतौर पर इसे ठीक कर देता है।
यह टूल कई लेखन प्रणालियों में बारह भाषाओं को कवर करता है — अंग्रेज़ी, सरलीकृत और पारंपरिक चीनी, जापानी, कोरियाई, स्पेनिश, फ़्रेंच, जर्मन, पुर्तगाली, अरबी, रूसी और हिंदी — इसलिए यह सिर्फ़ अंग्रेज़ी ही नहीं, बल्कि लैटिन, CJK, अरबी, सिरिलिक और देवनागरी टेक्स्ट भी संभालता है।
OCR अपने ब्राउज़र में क्यों चलाएँ
जिन छवियों को आप सबसे अधिक टेक्स्ट में बदलना चाहते हैं वे अक्सर सबसे निजी होती हैं: एक स्कैन किया पहचान-पत्र, एक वेतन पर्ची, एक चिकित्सा पत्र, आपके कार्ड नंबर वाली एक रसीद, किसी निजी चैट का स्क्रीनशॉट। इन्हें किसी क्लाउड OCR सेवा पर अपलोड करने का मतलब है मूल को ऐसे सर्वर को सौंपना जिस पर आपका नियंत्रण नहीं है।
ब्राउज़र-आधारित टूल इससे पूरी तरह बचता है। पहचान tesseract.js पर चलती है, जो एक WebAssembly OCR इंजन है और पृष्ठ के भीतर ही निष्पादित होता है; भाषा मॉडल एक बार डाउनलोड होकर कैश हो जाता है, और आपकी छवि आपके अपने डिवाइस पर संसाधित होती है। पहचान के दौरान कुछ भी प्रेषित नहीं होता, और एक बार मॉडल कैश हो जाने पर यह ऑफ़लाइन भी काम करता रहता है। वही गोपनीयता तर्क पूरे दस्तावेज़ कार्यप्रवाह में चलता है — किसी छवि से, फिर किसी PDF से टेक्स्ट निकालना, फिर उसे साफ़ करना: यदि फ़ाइल कभी आपकी मशीन से बाहर नहीं जाती, तो लीक होने को कुछ है ही नहीं।
त्वरित जाँच-सूची
- छवि को टूल में डालें — इसे स्थानीय रूप से पढ़ा जाता है, कोई अपलोड नहीं।
- जो सबसे तेज़, सबसे अधिक-कंट्रास्ट वाला संस्करण हो उसका उपयोग करें।
- पहचानने से पहले टेक्स्ट से मेल खाती भाषा चुनें।
- टेक्स्ट पहचानें पर क्लिक करें और विश्वास स्कोर जाँचें।
- परिणाम कॉपी करें — और याद रखें कि यह सब आपके डिवाइस पर ही हुआ।
त्वरित चरण
- 1OCR टेक्स्ट पहचान टूल खोलें और अपनी छवि उसमें डालें। कुछ भी अपलोड नहीं होता — तस्वीर आपके ब्राउज़र में स्थानीय रूप से पढ़ी जाती है।
- 2छवि में मौजूद टेक्स्ट की भाषा चुनें, फिर टेक्स्ट पहचानें पर क्लिक करें। टूल छवि को स्कैन करता है और एक विश्वास स्कोर के साथ शब्द लौटाता है।
- 3निकाले गए टेक्स्ट को कॉपी करें और जहाँ ज़रूरत हो वहाँ चिपकाएँ। छवि कभी आपके डिवाइस से बाहर नहीं जाती, इसलिए किसी निजी दस्तावेज़ का स्क्रीनशॉट भी आपकी मशीन पर ही रहता है।
अक्सर पूछे जाने वाले प्रश्न
OCR मुद्रित टेक्स्ट की स्पष्ट, उच्च-कंट्रास्ट छवियों पर सबसे अच्छा काम करता है: स्क्रीनशॉट, स्कैन किए दस्तावेज़, रसीदें, किताब के पन्ने, स्लाइड, और साइन या लेबल की फ़ोटो। हल्के पृष्ठभूमि पर सीधे और गहरे टेक्स्ट वाली तेज़, अच्छी रोशनी वाली छवियाँ सबसे सटीक परिणाम देती हैं। सजावटी फ़ॉन्ट, कम रिज़ॉल्यूशन, चमक और हस्तलेखन कठिन हैं और इनके लिए साफ़ छवि की ज़रूरत पड़ सकती है।
कई लिपियों में बारह भाषाएँ — अंग्रेज़ी, सरलीकृत और पारंपरिक चीनी, जापानी, कोरियाई, स्पेनिश, फ़्रेंच, जर्मन, पुर्तगाली, अरबी, रूसी और हिंदी। पहचान चलाने से पहले अपनी छवि के टेक्स्ट से मेल खाती भाषा चुनें ताकि इंजन सही वर्ण समूह का उपयोग करे।
सटीकता लगभग पूरी तरह छवि पर निर्भर करती है। मुद्रित टेक्स्ट का तेज़ स्कैन बहुत भरोसेमंद ढंग से पहचाना जाता है; धुंधली फ़ोन फ़ोटो या फीकी रसीद कठिन होती है। टूल हर परिणाम के साथ एक विश्वास स्कोर दिखाता है, और आप किसी तेज़, अधिक-कंट्रास्ट वाली छवि का उपयोग करके हमेशा सटीकता बढ़ा सकते हैं।
नहीं। पहचान tesseract.js पर चलती है, जो एक WebAssembly OCR इंजन है और आपके ब्राउज़र के भीतर काम करता है। भाषा मॉडल एक बार डाउनलोड होकर कैश हो जाता है, और आपकी छवि स्थानीय रूप से संसाधित होती है — कुछ भी सर्वर पर नहीं भेजा जाता, इसलिए पहचान-पत्र, रसीदें और चिकित्सा या वित्तीय कागज़ात जैसे निजी दस्तावेज़ आपके डिवाइस पर ही रहते हैं।