The what and where in visual object recognition
| Authors | |
|---|---|
| Supervisors | |
| Cosupervisors | |
| Award date | 07-12-2011 |
| ISBN |
|
| Number of pages | 126 |
| Organisations |
|
| Abstract |
Sinds kort zijn de technieken om objecten in beelden te herkennen nauwkeurig genoeg om te gebruiken in zoektaken, zoals bijvoorbeeld in Google Image search. Toch blijft het voor computers lastig om objecten te herkennen in een foto. Jasper Uijlings deed onderzoek naar het zogenaamde Bag-of-Words-model en leverde een bijdrage aan de versnelling van het algoritme. Bij het Bag-of-Words- model wordt het beeld opgedeeld in kleine stukjes. Ieder stukje wordt toegekend aan categorieën zoals hoekig, strepig, of egaal blauw. Vervolgens wordt aan het aantal stukjes hoekig en strepig bepaald of er bijvoorbeeld een koe in het plaatje staat. Wat vreemd is aan deze Bag-of-Words-representatie is dat de locatie van een object volledig wordt genegeerd. Uijlings concludeert dat het goed zou zijn om de objectlocatie weer terug te brengen. Daartoe ontwikkelde hij een methode die de objectlocatie op een efficiënte manier kan representeren. Hiermee is het mogelijk om meerdere objecten in een beeld te identificeren, in plaats van alleen individuele beelden.
|
| Document type | PhD thesis |
| Note | ASCI dissertation series no. 245 Research conducted at: Universiteit van Amsterdam |
| Language | English |
| Downloads | |
| Permalink to this page | |