Miễn phí OCR — Image to Text Extractor
Extract text from images, screenshots, and scanned documents using the open-source Tesseract OCR engine. Supports 20 languages. Runs entirely in your browser.
Thả tệp vào đây hoặc nhấp để duyệt
JPG, PNG, WebP, BMP không giới hạn kích thước tệp
Tệp của bạn không bao giờ rời khỏi thiết bị. Toàn bộ xử lý diễn ra cục bộ trong trình duyệt của bạn.
Optimize for your platform
Cách hoạt động
OCR (Optical Character Recognition) here uses the open-source Tesseract engine — the same engine Google has maintained for decades — compiled to WebAssembly so it runs natively in your browser.
- 1The OCR engine downloads as WebAssemblyOn first use, Tesseract.js loads as a WebAssembly module (~3 MB). It runs inside your browser like native code, with no plugins or extensions needed.
- 2A language model downloads for your chosen languageEach language has its own trained model (~5-15 MB each, depending on script complexity). You pick the language; only that language's data downloads. Your browser caches it for future use.
- 3You select or paste an imageThe image is read into your browser's memory. Tesseract analyzes the pixel data to identify character shapes — no upload, no API call.
- 4Text is extracted with a confidence scoreFor each detected word, Tesseract assigns a confidence percentage. High contrast and clean fonts give 95%+ confidence; messy handwriting or low resolution drops it.
Your images stay on your device — not even temporarily uploaded for processing. Safe for ID documents, contracts, medical paperwork, or any text with sensitive content.
Tại sao chọn của chúng tôi?
Công cụ liên quan
Nén hình ảnh
Nén hình ảnh JPG, PNG, WebP và AVIF. So sánh trước/sau.
Chuyển đổi định dạng hình ảnh
Chuyển đổi giữa JPG, PNG, WebP, AVIF, GIF và BMP.
Trình chỉnh sửa hình ảnh
Thay đổi kích thước hình ảnh theo kích thước hoặc tỷ lệ phần trăm. Duy trì tỷ lệ khung hình, chọn định dạng đầu ra, không làm giảm chất lượng.
