8:30 – 9:00 |
Registracija |
9:00 – 9:20 |
Pozdravni nagovor |
|
Dopoldanska sekcija |
9:20 – 9:50 |
Vabljeno predavanje
Peter Peer
Slikovna biometrija na pohodu
(več...)
V zadnjih petih letih se je v Laboratoriju za računalniški vid na FRI UL oblikovala močna skupina, ki dela na področju biometrije. Prvi ključni koraki so bili narejeni v okviru kompetenčnih centrov, kjer smo v oblaku naredili fuzijo dveh modalnosti, obrazov in prstih odtisov. Vzporedno s tem se je odvijalo takrat tudi delo na razpoznavanju ljudi iz načina gibanja. Nato pa je delo na področju biometrije dobilo še dodaten zagon, posvetili smo se povsem novi modalnosti uhljev, začeli delati na izzivu fotorealistične deidentifikacije, dodali beločnico, šarenico ter obočesno regijo kot naslednje tri sveže modalnosti. Na drugi stopnji študija smo uvedli tudi nov izbirni predmet Slikovna biometrija. Ta ima letos kar 80 slušateljev. Število članov skupine trenutno raste iz leta v leto, temu primerno tudi publikacije na ključnih konferencah ter v revijah, nenazadnje pa se vpliv skupine pozna tudi pri organizaciji tekmovanj na teh ključnih konferencah ter tudi zmagah na sorodnih tekmovanjih. Predavanje bo osvetlilo prehojeno pot skozi ključne raziskovalne vsebine.
|
9:50 – 10:05 |
Nejc Presečnik idr.
Preprocessing techniques for heterogeneous face recognition with off-the-shelf deep networks
(več...)
The task of Heterogeneous Face Recognition (HFR)
consists of matching face images captured in different imaging
domains, for example, visible light (VIS) images to near-infrared
(NIR) images. In comparison to face recognition with VIS
images only, attempting recognition with NIR images using
common (publicly available) pretrained deep convolutional
neural networks (DCNNs) usually results in suboptimal
performance, since most DCNNs are trained solely on VIS
image data. In this paper we investigate whether it is possible to
improve HFR with existing DCNN models trained explicitly for
VIS-image recognition through simple preprocessing techniques.
The idea here is to reduce the the difference in visual appearance
of the two types of images caused by imaging faces in different
modalities through preprocessing. To this end, we evaluate nine
different preprocessing techniques ranging from simple contrast
enhancement methods and photometric normalization
approaches to gradient operators and texture descriptors and
assess their impact on HFR performance in conjunction with the
popular VGGFace DCNN. Preprocessing techniques are
evaluated on two publicly available datasets, CARL and NIVL.
The results of our experiments show that it is possible to achieve
performance improvements through preprecessing if a suitable
approach is used. Our findings also suggest that there is ample
room for further research in this area.
|
10:05 – 10:20 |
Andrej Vovk
Koraki priprave 3D natisnjenega žilnega modela za namen načrtovanja operacije, z uporabo MR in CT slik pacienta z možgansko anevrizmo
(več...)
Za mikrokirurški način zdravljenja anevrizme je 3D
predstavitev patologije in njene okolice lahko v veliko pomoč pri
načrtovanju operacije. Slike možganov in ožilja lahko pridobimo
z neinvazivnim MR slikanjem. Običajno se v kliniki uporabi tudi
CT slikanje, ki pri pripravi 3D modela omogoča še prikaz
lobanje. Obdelava slik se začne s poravnavo posameznih 3D slik
na T1 strukturno sliko. Nato vsako posamezno 3D sliko
segmentiramo na način, da iz nje pridobimo želeno strukturo.
Naslednji korak je pretvorba posameznih segmentiranih slik oz.
želenih 3D volumenskih struktur v ploskovne modele.
Pripravljene ploskovne modele vseh izbranih struktur nato
združimo in jih dodatno obdelamo, ter po želji obarvamo, da čim
bolje predstavimo patologijo oz. področje zanimanja. Čeprav je
že 3D predstavitev z možnostjo rotacije na računalniku v veliko
pomoč pri predstavi struktur, je v primerih načrtovanja operacij
zelo uporabna tudi fizična predstavitev modela, ki jo dobimo s
3D tiskanjem.
|
10:20 – 10:35 |
Niko Gamulin idr.
Pupillary distance measurement with fully convolutional neural networkk
(več...)
In this paper we present the practical application of
numerical coordinate regression with convolutional neural
network for pupillary distance measurement. In case of applying
deep learning to a specific domain, it is difficult to construct a
large-scale dataset, which limits the end-to-end learning potential
of complex network architectures. Therefore, the problem has to
be addressed either by applying transfer learning or design an
architecture with a complexity level much lower than state of the
art models. For pupillary distance measurement, the latter
approach has led to satisfactory results.
|
10:35 – 10:50 |
Klemen Babuder idr.
Vizualizacija vzorca sožariščne mikroskopije s tehnologijo obogatene resničnosti
(več...)
V okviru tega prispevka je opisana aplikacija za
pametna očala Microsoft HoloLens. Aplikacija uporabniku
omogoča ogled in interakcijo s tridimenzionalnim vzorcem s
pomočjo tehnologije obogatene resničnosti. Uporabljen je
vzorec živčnega tkiva gensko spremenjene miši pridobljen s
sožariščno mikroskopijo. Skozi holografski vmesnik lahko
uporabnik spreminja lastnosti vzorca in pri tem izlušči dodatne
informacije.
|
10:50 – 11:05 |
Študentski prispevki
Marko Krajinović idr.
Upravljanje računalniške igre z mislimi
(več...)
Z možganski vmesniki lahko ustvarjamo unikatne in
inovativne načine interakcije s sodobno tehnologijo.
Predstavljajo neposredno povezavo med človekom in
računalnikom. V zadnjem desetletju je njihov razvoj močno
napredoval. Podjetja trenutno raziskujejo njihovo uporabo na
širših področjih. V namen raziskavam in izobraževanju podjetje
g.tec organizira hekaton BR41N.IO. Ta omogoča razvijalcem in
oblikovalcem, da se spoznajo s to tehnologijo. Jeseni sem se
udeležil tega hekatona v Trbovljah in razvil projekt Imagination
Solution. Prototip obsega računalniško igro v kateri uporabnik z
mislimi izbira virtualne pripomočke. Z njimi si pomaga pri
doseganju zastavljenega cilja.
|
|
Odmor za kavo |
11:45 – 12:00 |
Uroš Polanc idr.
Prepoznavanje šarenice s pomočjo nevronskih mrež
(več...)
Naloga obravnava pristop prepoznavanja oseb na
podlagi šarenice z nevronskimi mrežami. Ideja je, da na sliki
očesa pravilno detektiramo območje šarenice, s katerega nato s
primernimi metodami pridobimo tako imenovan vektor značilk.
Vektor značilk predstavlja kratek in unikaten opis posamezne
slike. Za nevronske mreže smo uporabili klasične nevronske
mreže, ki smo jim kot vhod podali vektorje značilk. Na koncu
smo preizkusili še konvolucijske nevronske mreže, kjer smo kot
vhod podali originalno sliko. Pri klasičnih nevronskih mrežah
smo testirali večje število kombinacij metod izboljšave slike,
metod izbire značilk ter nevronskih mrež. Izkazalo se je, da
mreže za prepoznavanje vzorcev v kombinaciji z Gaborjevimi
filtri dosegajo točnost 95,7 procenta. Pri konvolucijskih
nevronskih mrežah pa se je najbolje izkazala mreža ResNet50 s
točnostjo 96,4 procenta.
|
12:00 – 12:15 |
Jan Pavlin idr.
Latent space analysis of GANs for controlled face deidentification
(več...)
Each year more and more image and video data is being
shared and stored on a regular basis, which brings great threat of
peoples privacy. This is why face deidentification became an
important topic amongst privacy and security researches. Many
deidentification methods rely on pixelization or image blurring,
but in recent years techniques based on formal anonymity
models are replacing them. One of those possible models are
generative neural networks (GNNs). In this work we analyzed
the algorithm and latent space of GauGAN model. We tried to
implement a method, which could be able to change attributes
of generated image, based on manipulation of latent space.
Results show, that it is possible to manipulate some of given
attributes although we are unable to change mask of the image.
We also analyzed how generated image is affected if we use k-
nearest neighbours algorithm to manipulate latent space.
|
|
Kosilo |
|
Demonstracijska sekcija: "Globoko učenje: Praktični nasveti strokovnjakov" |
14:30 – 14:50 |
Dejan Štepec idr.
Towards visual anomaly detection in domains with limited amount of labeled data
(več...)
Napredek v globokem učenju je v zadnjih letih odprl veliko novih področij uporabe in obenem korenito izboljšal rezultate na obstoječih in tudi novih problemih s področja računalniškega vida. K uspehu metod globokega učenja je pripomoglo več dejavnikov – napredek v sami teoriji nevronskih mrež (npr. aktivacijske funkcije, novi postopki inicializacije in regularizacije parametrov, novi gradniki), kot tudi dostopnost velike množice označenih podatkov. Veliki količini dostopnih označenih podatkov navkljub, pa to ne velja za vse domene - v mnogo domenah ekspertno označenih podatkov ni enostavno pridobiti, kar onemogoča učinkovito rabo metod globokega učenja. Predavanje se osredotoča na rabo metod globokega učenja ob prisotnosti malo ali nič ekspertno označenih podatkov. V sklopu predavanja bomo predstavili različna domenska področja (slikovna biometrija, obdelava satelitskih posnetkov, obdelava medicinskih slik) in različne pristope, ki omogočajo tovrstno aplikacijo globokega učenja.
|
|
Študentski prispevki (nadaljevanje) |
14:50 – 15:05 |
David Pintarič idr.
Prepoznavanje aktivnosti osebe iz zaporedja slik z globokimi povratnimi nevronskimi mrežami
(več...)
V tem članku, v katerem povzemamo glavne rezultate
diplomskega dela prvega avtorja, se ukvarjamo s problemom
prepoznavanja aktivnosti osebe iz zaporedja slik. Prepoznavo
želimo izboljšati z upoštevanjem časovne komponente. To
dosežemo z uporabo povratnih nevronskih mrež. Omejili smo
se na naslednje aktivnosti: oseba ni v ravnovesju, se pripogiba,
stoji, sedi, leži, hitro in počasi hodi ter pada. Rezultati na 25
označenih videoposnetkih so pri uporabi povratne nevronske
mreže pokazali 83,2 % povprečno natančnost pri uporabi tipa
zaporedje v vektor in 75,5 % povprečno natančnost pri uporabi
tipa zaporedje v zaporedje. Kljub temu da so dobljeni rezultati
boljši od tistih, kjer ne upoštevamo časovne komponente,
ugotavljamo, da povratne nevronske mreže zaradi računske
zahtevnosti niso vedno najboljša izbira.
|
15:5 – 15:20 |
Vid Čermelj idr.
Evalvacija konvolucijskih nevronskih mrež na Raspberry Pi z USB pospeševalnikom Google Coral
(več...)
Pri uporabi napovednih modelov, ki temeljijo na
konvolucijskih nevronskih mrežah (CNN), smo pogosto
omejeni na visoko zmogljive sisteme. To zmanjša vsakodnevno
uporabnost, kjer bi si želeli poganjanje takih modelov na
mobilnih oziroma nizko zmogljivih napravah. S tem namenom
smo pregledali regijsko osnovane CNN detektorje in CNN
detektorje z enim prehodom ter evalvirali naučene modele na
mini računalniku Raspberry Pi 4 z uporabo USB pospeševalnika
Google Coral. Najboljše rezultate smo dobili z uporabo
modelov, ki so bili trenirani za izvajanje na Coral pospeševalniku
z uporabo ogrodja TensorFlow Lite. Najpočasnejši povprečni
čas obdelave slike ima model Faster R-CNN. Za izvajanje v
realnem času sta primerni različici YOLO V2 in V3 tiny, ki
omogočata obdelavo približno dveh slik na sekundo. Najboljše
rezultate smo dosegli z uporabo modela MobileNet V2 SSD
prilagojenega za Edge TPU. Povprečni čas obdelave slike je bil
17 milisekund, kar pomeni približno 60 sličic na sekundo.
|
|
Odmor za kavo |