De ce am creat un înlocuitor pentru dtSearch +12
- 06.04.17 08:39 •
- sochix •
- # 325786
- Habrahabr •
- 12 •
- 1600
- la fel ca Forbes, doar mai bine.
Am parcurs un drum lung de la utilizarea dtSearch la o soluție proprie. În acest articol, dorim să ne împărtășim experiența.
- Alegerea a fost între Cross, Copernic, Archivist, dtSearch și mai multe soluții exotice
- Compararea vitezei de interogare cu o cantitate mare de date a arătat un câștigător evident - dtSearch
- DtSearch la momentul respectiv a avut cea mai dezvoltată sintaxă de interogare, care ne-a permis să implementăm toate "punctele mai fine" ale recuperării informațiilor
- DtSearch are un API sub forma unei biblioteci pentru C #, pe care am folosit-o pentru a integra motorul în sistemul nostru. Nu este cea mai convenabilă opțiune, dar la acel moment a fost cea mai acceptabilă
Ce sa întâmplat în continuare
Ani au trecut, sistemul nostru sa dezvoltat și, treptat, dtSearch a devenit un loc îngust și problematic:
Lista continuă și continuă, dar orice altceva este mai mic, comparativ cu problemele enumerate mai sus.
Apoi, am considerat opțiunea de a crea un modul de căutare fulltext pentru sistemul nostru folosind Apache Tika + ElasticSearch sau Apache Solr, care ne-ar rezolva problema în ansamblul său. Cu toate acestea, am continuat să fim chinuiți de ideea că piața încă nu dispune de o soluție bună, cu interfețe rapide de căutare, OCR și interfață prietenoasă.
Prin urmare, fără să ne gândim mult timp, am decis să creăm propria noastră soluție open-source care ar face viața mai ușoară pentru toată lumea - așa sa născut Ambar.
Ambar - sistem de căutare a documentelor în format întreg
În procesul de dezvoltare, am ținut cont de toate problemele pe care le urmăriam cu dtSearch. Prin urmare, cerințele noastre de bază pentru sistem au fost: ușoare, intuitive, puternice și scalabile. Ne-am concentrat direct pe volumele în zeci și sute de milioane de fișiere, o condiție necesară a fost de căutare rapidă durează mai puțin de o jumătate de secundă, indiferent de complexitatea interogării și numărul de documente.
Principalele puncte despre sistemul nostru, care sunt importante pentru a ști:
> Blogul nostru. unde împărtășim toate faptele și evoluțiile interesante
Vă mulțumesc pentru atenție!