Gratis analysetechniek ongestructureerde informatie

9 augustus 2005

IBM is van plan zijn Unstructured Information Management Architecture
(UIMA) ter beschikking te stellen van software-ontwikkelaars. UIMA kan
teksten analyseren op betekenis, verbanden en feiten. Dat levert een
veel krachtiger zoekinstrument op dan de zoekmachines die met zoektemen
werken. IBM heeft vier jaar aan de ontwikkeling van UIMA gewerkt. Ook
universiteiten en de U.S. Defense Advanced Research Projects Agency
(DARPA) hebben aan hete project bijgedragen. Vijfien bedrijven hebben
volgens IBM inmiddels plannen om een zoektechniek op basis van UIMA te
ontwikkelen. De bekendste daarvan zijn Cognos, Factiva, SAS en SPSS.



Unstructured information management (UIM) applicaties zijn
softwaresystemen die ongestructureerde informatie (tekst, audio, video,
images e.d.) analyseren om relevante informatie voor de gebruiker te
ontdekken, organiseren en aan te leveren. Binnen UIM wordt een
variteit aan analysetechnieken gebruikt, zoals statistisch en
rule-based NLP (Natural Language Processing), Information Rterieval,
‘machine-learning’ en ontologien. IBM’s UIMA is een architectuur en
softwareplatform die creatie, ontdekking, samenstelling en gebruik van
een breed scala analysemogelijkheden mogelijk maakt en deze verbindt
aan gestructureerde informatie-zoekmiddelen, zoals databases en
zoekmachines. Dit platform voorziet in een run-time omgeving waarin
ontwikkelaars hun UIM-componenten kunnen testen en uiteindelijk kunnen
inbouwen in UIM-applicaties. Voor een beschrijving van de werking van
UIMA klik hier. Eind dit jaar is UIMA naar verwachting beschikbaar via de open-sourcesoftwaresite SourceForge.

Share This:

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.