Bu eklenti, Alfresco'daki resimlerden veya düz PDF'lerden OCR metnini çıkarmak için bir eylem sağlar. Lisans Eklenti, LGPL v3.0 altında lisanslanmıştır.
Eklenti sürümü 2.3.1
Uyumluluk Mevcut sürüm Alfresco 5.2 ve Alfresco SDK 3.0.2 kullanılarak geliştirilmiştir, Alfresco 5.1, 5.0 ve 4.2'de de çalışabilir.
Tarayıcı uyumluluğu: %100 destekleniyor
Desteklenen OCR yazılımları:
pdfsandwich
OCRmyPDF
Yerel hizmet olarak Windows.Media.OCR (bu yazılımı biz sağlamıyoruz, onu kendiniz oluşturmalısınız)
Diller şu anda Alfresco Share eylem arabirimi İngilizce, davranış arabirimi ise İngilizce, İspanyolca, Brezilya Portekizcesi, Almanca ve İtalyanca olarak sağlanmaktadır. OCR destekli diller kataloğu, doğrudan seçilen OCR yazılımına bağlıdır (Tesseract OCR veya Windows.Media.OCR)
Dağıtıma hazır eklentiyi indirme
İkili dağıtım, Alfresco'da modüller olarak dağıtılacak iki jar dosyasından oluşur:
repo JAR
share JAR
Bunları jar dosyalarını modül klasörüne yerleştirerek kurabilirsiniz:
Repo JAR'ı /opt/alfresco/modules/platform'a kopyalayın (yoksa dizini oluşturun)
Share JAR'ı /opt/alfresco/module/share'e kopyala
Pdfsandwich veya OCRmyPDF'i kurun.
PDFSandwich kurulumu MacOS için:
brew install pdfsandwich
OCRmyPDF kurulumu MacOS için:
brew install ocrmypdf
Not: diğer işletim sistemleri için pdfsandwich kurulum komutları:
Debian apt-get install pdfsandwich
Ubuntu apt-get install pdfsandwich
Kali Linux apt-get install pdfsandwich
Raspbian apt-get install pdfsandwich
Languages
OCRmyPDF uses Tesseract for OCR, and relies on its language packs. For Linux users, you can often find packages that provide language packs:
Tüm Tesseract dil paketlerinin bir listesini görüntülemek için:
apt-cache search tesseract-ocr
# Debian/Ubuntu users
Örnek: Basitleştirilmiş Çince dil paketini yüklemek için:
apt-get install tesseract-ocr-chi-sim
# brew macOS users
brew install tesseract-lang
Sonra alfresco-global properties dosyasında ilgili eklemeleri yapın.
OCRmyPDF kullanıyorsanız:
ocr.command=/usr/local/bin/ocrmypdf
ocr.output.verbose=true
ocr.output.file.prefix.command=
ocr.extra.commands=--verbose 1 --force-ocr -l spa+eng+fra
ocr.server.os=linux
Pdfsandwich kullanıyorsanız:
ocr.command=/usr/bin/pdfsandwich
ocr.output.verbose=true
ocr.output.file.prefix.command=-o
ocr.extra.commands=-verbose -lang spa+eng+fra
ocr.server.os=linux
Dosyaları kopyaladıktan ve değişi sonra Alfresco'yu yeniden başlatın.