Fakulteta za elektrotehniko, računalništvo in informatiko Fakulteta za elektrotehniko, računalništvo in informatiko Laboratorij za sistemsko programsko opremo Slovensko društvo za razpoznavanje vzorcev Slovenska sekcija IEEE

Program konference

Prenos programa konference: pdf

Navodila za Predstavitev: pdf

Prostor konference: G2-Beta (UM-FERI)

8:30 – 9:00 Registracija
9:00 – 9:20 Pozdravni nagovor
Dopoldanska sekcija
9:20 – 9:50 Vabljeno predavanje
Peter Peer

Slikovna biometrija na pohodu
(več...)

V zadnjih petih letih se je v Laboratoriju za računalniški vid na FRI UL oblikovala močna skupina, ki dela na področju biometrije. Prvi ključni koraki so bili narejeni v okviru kompetenčnih centrov, kjer smo v oblaku naredili fuzijo dveh modalnosti, obrazov in prstih odtisov. Vzporedno s tem se je odvijalo takrat tudi delo na razpoznavanju ljudi iz načina gibanja. Nato pa je delo na področju biometrije dobilo še dodaten zagon, posvetili smo se povsem novi modalnosti uhljev, začeli delati na izzivu fotorealistične deidentifikacije, dodali beločnico, šarenico ter obočesno regijo kot naslednje tri sveže modalnosti. Na drugi stopnji študija smo uvedli tudi nov izbirni predmet Slikovna biometrija. Ta ima letos kar 80 slušateljev. Število članov skupine trenutno raste iz leta v leto, temu primerno tudi publikacije na ključnih konferencah ter v revijah, nenazadnje pa se vpliv skupine pozna tudi pri organizaciji tekmovanj na teh ključnih konferencah ter tudi zmagah na sorodnih tekmovanjih. Predavanje bo osvetlilo prehojeno pot skozi ključne raziskovalne vsebine.

9:50 – 10:05 Nejc Presečnik idr.
Preprocessing techniques for heterogeneous face recognition with off-the-shelf deep networks
(več...)

The task of Heterogeneous Face Recognition (HFR) consists of matching face images captured in different imaging domains, for example, visible light (VIS) images to near-infrared (NIR) images. In comparison to face recognition with VIS images only, attempting recognition with NIR images using common (publicly available) pretrained deep convolutional neural networks (DCNNs) usually results in suboptimal performance, since most DCNNs are trained solely on VIS image data. In this paper we investigate whether it is possible to improve HFR with existing DCNN models trained explicitly for VIS-image recognition through simple preprocessing techniques. The idea here is to reduce the the difference in visual appearance of the two types of images caused by imaging faces in different modalities through preprocessing. To this end, we evaluate nine different preprocessing techniques ranging from simple contrast enhancement methods and photometric normalization approaches to gradient operators and texture descriptors and assess their impact on HFR performance in conjunction with the popular VGGFace DCNN. Preprocessing techniques are evaluated on two publicly available datasets, CARL and NIVL. The results of our experiments show that it is possible to achieve performance improvements through preprecessing if a suitable approach is used. Our findings also suggest that there is ample room for further research in this area.

10:05 – 10:20 Andrej Vovk
Koraki priprave 3D natisnjenega žilnega modela za namen načrtovanja operacije, z uporabo MR in CT slik pacienta z možgansko anevrizmo
(več...)

Za mikrokirurški način zdravljenja anevrizme je 3D predstavitev patologije in njene okolice lahko v veliko pomoč pri načrtovanju operacije. Slike možganov in ožilja lahko pridobimo z neinvazivnim MR slikanjem. Običajno se v kliniki uporabi tudi CT slikanje, ki pri pripravi 3D modela omogoča še prikaz lobanje. Obdelava slik se začne s poravnavo posameznih 3D slik na T1 strukturno sliko. Nato vsako posamezno 3D sliko segmentiramo na način, da iz nje pridobimo želeno strukturo. Naslednji korak je pretvorba posameznih segmentiranih slik oz. želenih 3D volumenskih struktur v ploskovne modele. Pripravljene ploskovne modele vseh izbranih struktur nato združimo in jih dodatno obdelamo, ter po želji obarvamo, da čim bolje predstavimo patologijo oz. področje zanimanja. Čeprav je že 3D predstavitev z možnostjo rotacije na računalniku v veliko pomoč pri predstavi struktur, je v primerih načrtovanja operacij zelo uporabna tudi fizična predstavitev modela, ki jo dobimo s 3D tiskanjem.

10:20 – 10:35 Niko Gamulin idr.
Pupillary distance measurement with fully convolutional neural networkk
(več...)

In this paper we present the practical application of numerical coordinate regression with convolutional neural network for pupillary distance measurement. In case of applying deep learning to a specific domain, it is difficult to construct a large-scale dataset, which limits the end-to-end learning potential of complex network architectures. Therefore, the problem has to be addressed either by applying transfer learning or design an architecture with a complexity level much lower than state of the art models. For pupillary distance measurement, the latter approach has led to satisfactory results.

10:35 – 10:50 Klemen Babuder idr.
Vizualizacija vzorca sožariščne mikroskopije s tehnologijo obogatene resničnosti
(več...)

V okviru tega prispevka je opisana aplikacija za pametna očala Microsoft HoloLens. Aplikacija uporabniku omogoča ogled in interakcijo s tridimenzionalnim vzorcem s pomočjo tehnologije obogatene resničnosti. Uporabljen je vzorec živčnega tkiva gensko spremenjene miši pridobljen s sožariščno mikroskopijo. Skozi holografski vmesnik lahko uporabnik spreminja lastnosti vzorca in pri tem izlušči dodatne informacije.

10:50 – 11:05 Študentski prispevki
Marko Krajinović idr.

Upravljanje računalniške igre z mislimi
(več...)

Z možganski vmesniki lahko ustvarjamo unikatne in inovativne načine interakcije s sodobno tehnologijo. Predstavljajo neposredno povezavo med človekom in računalnikom. V zadnjem desetletju je njihov razvoj močno napredoval. Podjetja trenutno raziskujejo njihovo uporabo na širših področjih. V namen raziskavam in izobraževanju podjetje g.tec organizira hekaton BR41N.IO. Ta omogoča razvijalcem in oblikovalcem, da se spoznajo s to tehnologijo. Jeseni sem se udeležil tega hekatona v Trbovljah in razvil projekt Imagination Solution. Prototip obsega računalniško igro v kateri uporabnik z mislimi izbira virtualne pripomočke. Z njimi si pomaga pri doseganju zastavljenega cilja.

Odmor za kavo
11:45 – 12:00 Uroš Polanc idr.
Prepoznavanje šarenice s pomočjo nevronskih mrež
(več...)

Naloga obravnava pristop prepoznavanja oseb na podlagi šarenice z nevronskimi mrežami. Ideja je, da na sliki očesa pravilno detektiramo območje šarenice, s katerega nato s primernimi metodami pridobimo tako imenovan vektor značilk. Vektor značilk predstavlja kratek in unikaten opis posamezne slike. Za nevronske mreže smo uporabili klasične nevronske mreže, ki smo jim kot vhod podali vektorje značilk. Na koncu smo preizkusili še konvolucijske nevronske mreže, kjer smo kot vhod podali originalno sliko. Pri klasičnih nevronskih mrežah smo testirali večje število kombinacij metod izboljšave slike, metod izbire značilk ter nevronskih mrež. Izkazalo se je, da mreže za prepoznavanje vzorcev v kombinaciji z Gaborjevimi filtri dosegajo točnost 95,7 procenta. Pri konvolucijskih nevronskih mrežah pa se je najbolje izkazala mreža ResNet50 s točnostjo 96,4 procenta.

12:00 – 12:15 Jan Pavlin idr.
Latent space analysis of GANs for controlled face deidentification
(več...)

Each year more and more image and video data is being shared and stored on a regular basis, which brings great threat of peoples privacy. This is why face deidentification became an important topic amongst privacy and security researches. Many deidentification methods rely on pixelization or image blurring, but in recent years techniques based on formal anonymity models are replacing them. One of those possible models are generative neural networks (GNNs). In this work we analyzed the algorithm and latent space of GauGAN model. We tried to implement a method, which could be able to change attributes of generated image, based on manipulation of latent space. Results show, that it is possible to manipulate some of given attributes although we are unable to change mask of the image. We also analyzed how generated image is affected if we use k- nearest neighbours algorithm to manipulate latent space.

Kosilo
Demonstracijska sekcija: "Globoko učenje: Praktični nasveti strokovnjakov"
14:30 – 14:50 Dejan Štepec idr.
Towards visual anomaly detection in domains with limited amount of labeled data
(več...)

Napredek v globokem učenju je v zadnjih letih odprl veliko novih področij uporabe in obenem korenito izboljšal rezultate na obstoječih in tudi novih problemih s področja računalniškega vida. K uspehu metod globokega učenja je pripomoglo več dejavnikov – napredek v sami teoriji nevronskih mrež (npr. aktivacijske funkcije, novi postopki inicializacije in regularizacije parametrov, novi gradniki), kot tudi dostopnost velike množice označenih podatkov. Veliki količini dostopnih označenih podatkov navkljub, pa to ne velja za vse domene - v mnogo domenah ekspertno označenih podatkov ni enostavno pridobiti, kar onemogoča učinkovito rabo metod globokega učenja. Predavanje se osredotoča na rabo metod globokega učenja ob prisotnosti malo ali nič ekspertno označenih podatkov. V sklopu predavanja bomo predstavili različna domenska področja (slikovna biometrija, obdelava satelitskih posnetkov, obdelava medicinskih slik) in različne pristope, ki omogočajo tovrstno aplikacijo globokega učenja.

Študentski prispevki (nadaljevanje)
14:50 – 15:05 David Pintarič idr.
Prepoznavanje aktivnosti osebe iz zaporedja slik z globokimi povratnimi nevronskimi mrežami
(več...)

V tem članku, v katerem povzemamo glavne rezultate diplomskega dela prvega avtorja, se ukvarjamo s problemom prepoznavanja aktivnosti osebe iz zaporedja slik. Prepoznavo želimo izboljšati z upoštevanjem časovne komponente. To dosežemo z uporabo povratnih nevronskih mrež. Omejili smo se na naslednje aktivnosti: oseba ni v ravnovesju, se pripogiba, stoji, sedi, leži, hitro in počasi hodi ter pada. Rezultati na 25 označenih videoposnetkih so pri uporabi povratne nevronske mreže pokazali 83,2 % povprečno natančnost pri uporabi tipa zaporedje v vektor in 75,5 % povprečno natančnost pri uporabi tipa zaporedje v zaporedje. Kljub temu da so dobljeni rezultati boljši od tistih, kjer ne upoštevamo časovne komponente, ugotavljamo, da povratne nevronske mreže zaradi računske zahtevnosti niso vedno najboljša izbira.

15:5 – 15:20 Vid Čermelj idr.
Evalvacija konvolucijskih nevronskih mrež na Raspberry Pi z USB pospeševalnikom Google Coral
(več...)

Pri uporabi napovednih modelov, ki temeljijo na konvolucijskih nevronskih mrežah (CNN), smo pogosto omejeni na visoko zmogljive sisteme. To zmanjša vsakodnevno uporabnost, kjer bi si želeli poganjanje takih modelov na mobilnih oziroma nizko zmogljivih napravah. S tem namenom smo pregledali regijsko osnovane CNN detektorje in CNN detektorje z enim prehodom ter evalvirali naučene modele na mini računalniku Raspberry Pi 4 z uporabo USB pospeševalnika Google Coral. Najboljše rezultate smo dobili z uporabo modelov, ki so bili trenirani za izvajanje na Coral pospeševalniku z uporabo ogrodja TensorFlow Lite. Najpočasnejši povprečni čas obdelave slike ima model Faster R-CNN. Za izvajanje v realnem času sta primerni različici YOLO V2 in V3 tiny, ki omogočata obdelavo približno dveh slik na sekundo. Najboljše rezultate smo dosegli z uporabo modela MobileNet V2 SSD prilagojenega za Edge TPU. Povprečni čas obdelave slike je bil 17 milisekund, kar pomeni približno 60 sličic na sekundo.

Odmor za kavo