Alfresco Basit OCR Kurulumu

Bu eklenti, Alfresco'daki resimlerden veya düz PDF'lerden OCR metnini çıkarmak için bir eylem sağlar. Lisans Eklenti, LGPL v3.0 altında lisanslanmıştır.

Eklenti sürümü 2.3.1

Uyumluluk Mevcut sürüm Alfresco 5.2 ve Alfresco SDK 3.0.2 kullanılarak geliştirilmiştir, Alfresco 5.1, 5.0 ve 4.2'de de çalışabilir.

Tarayıcı uyumluluğu: %100 destekleniyor

Desteklenen OCR yazılımları:

  • pdfsandwich

  • OCRmyPDF

  • Yerel hizmet olarak Windows.Media.OCR (bu yazılımı biz sağlamıyoruz, onu kendiniz oluşturmalısınız)

Diller şu anda Alfresco Share eylem arabirimi İngilizce, davranış arabirimi ise İngilizce, İspanyolca, Brezilya Portekizcesi, Almanca ve İtalyanca olarak sağlanmaktadır. OCR destekli diller kataloğu, doğrudan seçilen OCR yazılımına bağlıdır (Tesseract OCR veya Windows.Media.OCR)

Dağıtıma hazır eklentiyi indirme

İkili dağıtım, Alfresco'da modüller olarak dağıtılacak iki jar dosyasından oluşur:

  • repo JAR

  • share JAR

Bunları jar dosyalarını modül klasörüne yerleştirerek kurabilirsiniz:

Repo JAR'ı /opt/alfresco/modules/platform'a kopyalayın (yoksa dizini oluşturun)

Share JAR'ı /opt/alfresco/module/share'e kopyala


Pdfsandwich veya OCRmyPDF'i kurun.

PDFSandwich kurulumu MacOS için:

brew install pdfsandwich


OCRmyPDF kurulumu MacOS için:

brew install ocrmypdf


Not:  diğer işletim sistemleri için pdfsandwich kurulum komutları:

Debian apt-get install pdfsandwich

Ubuntu apt-get install pdfsandwich

Kali Linux apt-get install pdfsandwich

Raspbian apt-get install pdfsandwich


Languages

OCRmyPDF uses Tesseract for OCR, and relies on its language packs. For Linux users, you can often find packages that provide language packs:


Tüm Tesseract dil paketlerinin bir listesini görüntülemek için:

apt-cache search tesseract-ocr

# Debian/Ubuntu users

Örnek: Basitleştirilmiş Çince dil paketini yüklemek için:

apt-get install tesseract-ocr-chi-sim

# Arch Linux users

Örneğin: İngilizce ve Almanca dil paketlerini yüklemek için:

pacman -S tesseract-data-eng tesseract-data-deu

# brew macOS users

brew install tesseract-lang


Sonra alfresco-global properties dosyasında ilgili eklemeleri yapın.

Pdfsandwich kullanıyorsanız:

ocr.command=/usr/local/bin/ocrmypdf

ocr.output.verbose=true

ocr.output.file.prefix.command=

ocr.extra.commands=--verbose 1 --force-ocr -l spa+eng+fra

ocr.server.os=linux

OCRmyPDF kullanıyorsanız:

ocr.command=/usr/bin/pdfsandwich

ocr.output.verbose=true

ocr.output.file.prefix.command=-o

ocr.extra.commands=-verbose -lang spa+eng+fra

ocr.server.os=linux


Dosyaları kopyaladıktan ve değişi sonra Alfresco'yu yeniden başlatın.

Alfresco Web Quick Start'ı kurma ve yapılandırma
Alfresco İçerik Hizmetleri deposu, WCM için Web Hızlı Başlangıç (WQS) adı verilen bir uygulama sağlar.