doublons d'annotations

Vous pouvez poser ici des questions en français.

doublons d'annotations

Post by matben » Sat Apr 10, 2010 9:24 am

Bonjour,

il serait tres utile d'avoir un WARNING dans Advene indiquant que l'on a un doublon (temporel) d'annotation sur une meme ligne, par exemple au moment d'enregistrer son package.
En effet on ne voit pas visuellement ces doublons sur la ligne de temps, et il peuvent ensuite fausser le calcul automatique de statistiques (type rappel/precision) lorsque l'on utilise ces annotations comme verite terrain (ca vient de m'arriver a 2 jours d'une dead-line d'article !!! ;) )
Il suffirait de proposer lors du WARNING de supprimer automatiquement ces doublons (ou non).

Mathieu

PS: hyper facile de reperer les doublons avec un dictionnaire (cf code ci-dessous)

# coding: utf-8
import sys, os
import xml.dom.ext
from xml.dom.ext.reader.Sax import FromXmlFile

afile = sys.argv[1]

# parse ground-truth file (in Advene .xml format)
xmltree = FromXmlFile(afile)

annotations = [elem for elem in xmltree.getElementsByTagName("annotation")]
segmap = {}
for a in annotations:
gtsegs = [elem for elem in a.getElementsByTagName("millisecond-fragment")]
for gtseg in gtsegs:
begin = gtseg.getAttribute('begin')
end = gtseg.getAttribute('end')
if begin+'_'+end not in segmap:
segmap[begin+'_'+end] = 1
else:
print "%s -> id=%s" % (afile, a.getAttribute('id'))
matben
Posts: 2
Joined: Tue May 05, 2009 4:27 pm

Re: doublons d'annotations

Post by oaubert » Tue Apr 20, 2010 9:29 am

Bonjour

Ça (re)pose la question de la gestion des recouvrements d'annotation, plus large que les simples doublons. Beaucoup de logiciels d'annotation interdisent purement et simplement le recouvrement, ça simplifie les choses. On a fait le choix de ne pas l'interdire, mais ça pose des problèmes en termes de visualisation.
Par rapport à la solution proposée, ça fonctionne pour un cas précis (les doublons), mais ça ne règle pas d'autres problèmes (recouvrements totaux ou partiels). On a quelques idées pour limiter le problème et améliorer la visualisation (dans le cadre d'une réécriture de la timeline), mais les suggestions sont bienvenues.

Olivier
oaubert
Site Admin
Posts: 88
Joined: Mon Jan 07, 2008 4:02 pm


Return to Questions en francais