Document Archiving Server
Aceasta componenta este responsabila pentru stocarea, indexarea si arhivarea documentelor. In momentul in care un document ajunge in baza de date de documente, sistemul va extrage continutul text din documente (folosind tehnologia OCR, daca este cazul) si va arhiva documentele in formatul configurat (PDF, PDF/A-1b, PDF/A-3b). Componenta ruleaza sub forma unui service, sub sistemul de operare Microsoft Windows.
Procesarea documentelor office (.doc, .docx, .rtf, .txt, .dotx, .odf, .xls, .xlsx)
- se deschide fisierul;
- se extrage textul din fisier;
- se arhiveaza (se converteste in formatul configurat).
Procesarea imaginilor (.tif, .tiff, .png, .jpg, .jpeg, .bmp)
- se deschide fisierul;
- se extrage textul din fisier prin OCR;
- se arhiveaza (se converteste in formatul configurat).
Procesarea documentelor PDF
- se deschide fisierul;
- daca pagina contine text, se extrag textele;
- daca pagina contine o singura imagine, se extrag textele prin OCR;
- se arhiveaza (se converteste in formatul configurat).
Procesarea mesajelor de e-mail
- arhivarea automata a conturilor de e-mail (Gmail, Yahoo, etc.) prin interfata IMAP;
- mesajele se citesc periodic din serverul de e-mail;
- mesajele citite se import in sistem;
- mesajele se convertesc in format PDF, PDF/A-1b sau PDF/A-3b;
- in cazul in care formatul de arhivare este PDF sau PDF/A-3b, atasamentele mesajelor sunt adaugate in PDF.