Program konference, Zvané přednášky (abstrakty), Registrace.


Program konference Data a znalosti 2017

Ke stažení: Program konference v PDF, Sborník konference Data a znalosti 2017

Čtvrtek 5. října 2017

8:00 – 12:00 Registrace účastníků konference
9:00 – 9:20 Zahájení konference: Josef Steinberger, Dalibor Fiala, Karel Ježek a zástupce katedry/fakulty
Zvané přednášky 1 (Předseda sekce: Josef Steinberger)
9:20 – 10:00 Sémantická analýza ve forenzním vyšetřování
Kateřina Veselovská (Deloitte)
10:00 - 10:40 Data Science a umělá inteligence v O2
Jan Romportl (O2)
10:40 - 11:00 Přestávka s občerstvením
11:00 - 11:40 Moderní přístupy ke strojovému generování textů
Jiří Materna (Machine learning guru)
Konferenční příspěvky (Předseda sekce: Ján Paralič)
11:40 - 12:30
  • SISel: Aviation Safety Powered by Semantic Technologies
    Martin Ledvinka, Petr Křemen, Bogdan Kostov a Miroslav Blaško
  • OLAP Recommender: Supporting Navigation in OLAP Cubes Using Association Rule Mining
    Bohuslav Koukal, David Chudán a Vojtěch Svátek
  • Interaktívna vizualizácia hierarchických štruktúr
    Miroslav Smatana a Peter Butka
  • Information Extraction from the Web by Matching Visual Presentation Patterns
    Matej Minárik a Radek Burget
  • Využití formálních gramatik v automatickém plánování - na cestě k sjednocujícímu modelu
    Roman Barták
  • Využití EasyMiner API v projektu OpenBudgets.eu
    Stanislav Vojíř, Václav Zeman, Jaroslav Kuchař a Tomáš Kliegr
12:30 - 14:00 Oběd
Zvané přednášky 2 (Předseda sekce: Josef Steinberger)
14:00 - 14:40 Bot framework a Cognitive services aneb sestavte si vlastního inteligentního bota
Lukáš Kohut (Microsoft)
14:40 - 15:20 Jak se pečou data v Socialbakers
Milan Lepík (Socialbakers)
Upoutávky posterů (Předseda sekce: Dalibor Fiala)
15: 20 – 15:50
  • Efektivní analýza velkých dat pomocí Apache Spark a samoučících neuronových sítí na jediném počítači
    David Andrešič a Petr Šaloun
  • Exploračná analýza medicínskych záznamov
    František Babič, Michal Vadovský a Ján Paralič
  • UWB at SemEval 2014 and 2016
    Tomáš Brychcín, Tomáš Hercig, Lukáš Svoboda a Michal Konkol
  • Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí
    Přemysl Václav Duben a Stanislav Vojíř
  • Získávání dat z bibliografických databází
    Dalibor Fiala
  • Recommending News Articles using Rule-based Classifier
    Christián Golian a Jaroslav Kuchař
  • Včasná identifikácia trendov v správaní používateľov elektronického zľavového portálu
    Ondrej Kaššák a Mária Bieliková
  • Pokroky v analýze heterogenních neuroinformatických dat
    Ondřej Klempíř, Václav Čejka, Jan Tesař a Radim Krupička
  • Data integration for customer preference learning
    Michal Kopecký, Marta Vomlelová a Peter Vojtáš
  • Kripke style Dynamic model for Web Annotation with Similarity and Reliability
    Michal Kopecký, Marta Vomlelová a Peter Vojtáš
  • Predikcia spotových cien elektriny
    Róbert Magyar a Viera Rozinajová
  • Anotovanie slovníka pre analýzu sentimentu pomocou PSO
    Martin Mikula a Kristína Machová
  • Porovnanie algoritmov na analýzu sekvencií pohľadu
    Róbert Móro, Michal Melúch, Martin Mokrý a Mária Bieliková
  • Interaktívna vizualizácia výsledkov vyhľadávania informácií pomocou konceptových zväzov
    Veronika Novotná, Peter Butka a Miroslav Smatana
  • Minimal Transportation Disruptions Model and Ontologies for Modelling of Disruptive Events
    Josef Petrák
  • Towards User-friendly and High-performance Analytics with Big Data Historian
    Martin Possolt, Václav Jirkovský a Marek Obitko
  • Projekt MONSOON – návrh platformy pre analýzu veľkých dát v priemysle
    Martin Sarnovský a Peter Bednár
  • First Insight into the Processing of the Historical Documents from the Period of Totalitarian Regimes
    Lucie Skorkovská, Petr Neduchal, Zbyněk Zajíc, Pavel Ircing, Luděk Müller a Lukáš Bureš
  • Hierarchické prístupy k modelovaniu témy v dokumentech
    Miroslav Smatana, Peter Butka a Matúš Gore
  • Vyhľadávanie významných konceptov v rámci konceptuálnej analýzy dát
    Miroslav Smatana, Peter Butka a Zuzana Čabalová
  • Analýza zpravodajských textů a jejich komentářů napříč jazyky
    Josef Steinberger
  • Fokusovaná kategorizační síla webových ontologií
    Vojtěch Svátek, Ondřej Zamazal a Miroslav Vacura
  • Ontology Learning for Facilitating Ontology Matching in Automotive
    Ondřej Šebek, Václav Jirkovský, Nestor Rychtyckyj a Petr Kadera
  • Automatizace klasifikace evropských projektů pomocí klasifikátoru
    Ondřej Zamazal
  • Univerzální řešení domén v relační databázi
    Martin Zíma, Michal Nykl a Martin Dostal
15:50 - 17:30 Postery s občerstvením
16:30 - 17:30 Schůze řídícího výboru
18:00 - 19:30 Exkurze do pivovaru Prazdroj (1. skupina 18:00 - 19:00, 2. skupina 18:15 - 19:15)
20:00 - 22:30 Společenský večer s rautem

Pátek 6. října 2017

Vybraný příspěvek (Předseda sekce: Karel Ježek)
9:00 – 9:40 Relační a NoSQL databáze: dvě strany téže mince?
Jaroslav Pokorný
Doktorandské sympozium (Předseda sekce: Mária Bieliková)
9:40 – 11:00
  • Použitie spracovaných záznamov reči pacientov pre určenie štádia Parkinsonovej choroby
    Michal Vadovský a Ján Paralič
  • Analýza dát za účelom zlepšenia konkrétneho procesu logistickej firmy
    Miroslava Muchová a Ján Paralič
  • Procedurální znalosti expertů a model GLIF
    Ondřej Říha
  • Personalizované odporúčanie využívajúce vizuálne stimuly
    Peter Gašpar, Michal Kompan a Mária Bieliková
  • The agent-based model of the dynamic spectrum access networks based on the bilateral bargaining
    Marcel Vološin, Eugen Šlapak a Juraj Gazda
  • Predikcia úpadku spoločností s ručením obmedzeným využitím metód pre rozpoznanie odľahlých bodov
    Peter Gnip, Martin Zoričák a Peter Drotár
  • Detecting Anomalous Trajectories and Traffic Services
    Mazen Ismael
  • Applying Trusted Knowledge in Evaluation Phase of Data Mining
    Viktor Nekvapil
  • Učenie s prenosom medzi prirodzenými jazykmi
    Matúš Pikuliak, Marián Šimko a Mária Bieliková
  • Smerom k automatickej detekcii problémov s použiteľnosťou prostredníctvom sledovania pohľadu
    Martin Svrček a Mária Bieliková
11:00 – 12:20 Postery s občerstvením
12:20 – 12:30 Zakončení konference
12:30 – 14:00 Oběd


Zvané přednášky (abstrakty)

Zvanou přednášku nám potvrdili:
Deloitte - Kateřina Veselovská,
O2 - Jan Romportl,
Microsoft - Lukáš Kohut,
Socialbakers - Milan Lepík,
Seznam.cz (ex) - Jiří Materna.


Kateřina Veselovská, Deloitte ČR

Sémantická analýza ve forenzním vyšetřování

Kateřina Veselovská
Semantic Data Science Lead, Analytic & Forensic Technology,
Deloitte ČR
Včasné vyhodnocení závažnosti případu a správná identifikace klíčových slov jsou v rámci forenzního vyšetřování dlouhodobě zásadními kompetencemi. Objem analyzovaných textových dat ale stále roste a častěji se také setkáváme s případy zahrnujícími data z mnoha různých jazyků. Tradiční přístupy k prohledávání dat zastarávají, ukazují se jako nákladné a nepraktické. Při hledání vzorců a trendů v datech již není možné spoléhat se výhradně na manuální analýzy. V tomto příspěvku ukážeme, jak využíváme nejnovější přístupy z oblasti počítačového zpracování přirozeného jazyka pro účely automatické analýzy nestrukturovaného obsahu a identifikaci vyhledávaných slov ve forenzní analytice, a uvedeme konkrétní příklady ilustrující úsporu času a nákladů při uplatnění sémantické analýzy ve forenzním vyšetřování.


Jan Romportl, O2 ČR

Data Science a umělá inteligence v O2


Jan Romportl
Chief Data Scientist,
O2 ČR
Data Science tým O2 pracuje nad rozsáhlými heterogenními zdroji dat, které integruje ve své Big Data platformě a která pokrývají poměrně široké spektrum od signalizací z mobilní sítě přes webový provoz, geolokační data, IPTV či zákaznické chování, až po různé druhy textových dat. Přednáška tedy nejprve stručně představí roli Data Science týmu uvnitř struktury O2 Czech Republic, dále podrobněji popíše konkrétní zdroje dat a platformy, s nimiž pracujeme, a pak se zaměří hlavně na metody, které nejčastěji používáme, jakou roli v nich hraje aplikovaná umělá inteligence, kde využíváme deep learning či kde je naopak nutno použít lineární, snadno interpretovatelné modely. Vzhledem k tomu, že přednáška proběhne mezi akademiky, tak se nebude moci vyhnout ani představení toho, jak v O2 využíváme metody strojového zpracování přirozeného jazyka. Na závěr přednáška zmíní, jak je to s bezpečností dat a ochranou citlivých informací.


Lukáš Kohut, Microsoft CEE

Bot framework a Cognitive services
aneb sestavte si vlastního inteligentního bota


Lukáš Kohut
ASSC Consultant,
Microsoft CEE
Microsoft investuje v poslední době nemalé finanční prostředky do rozvoje kognitivních služeb umožňujících rozvíjet umělou inteligenci v netradičních řešeních. Jedno z aktuálních témat dneška je využití umělé inteligence v podobě bota, který umožňuje vést konverzaci formou textu nebo hlasu. Díky spojení umělé inteligence a jakékoliv konverzační platformy se otevírají úplně nové možnosti, jak lze pomocí přirozeného jazyka lépe vyhledávat informace nebo řešit specifické úlohy. Cílem přednášky je představit kognitivní služby pracující s textovým obsahem a blíže si představit využití botů ve společnosti.


Milan Lepík, Socialbakers

Jak se pečou data v Socialbakers


Milan Lepík
Director of Data Platform,
Socialbakers
Socialbakers pomáhají firmám měřit úspěšnost na sociálních sítích jako Facebook, Twitter, Instagram či Youtube. Mezi zákazníky firmy patří polovina největších světových firem z žebříčku Fortune 500. Základem analýz jsou data. Každou vteřinu se odešle 1.000 požadavků na věřejně dostupná API sociálních sítí, takto získaná data jsou v systému dostupná okamžitě po uložení do databáze, včetně výsledku výpočtu agregací klíčových metrik. Fulltext hledání nad 1 miliardou příspěvků v clusteru se pohybuje pod 3s. Přednáška je zaměřená na popis silných a slabých stránek vyzkoušených databázových technologií z pohledu potřeb Socialbakers.


Jiří Materna, Seznam.cz (ex)

Moderní přístupy ke strojovému generování textů


Jiří Materna
Machine Learning Freelancer
Head of Research,
Seznam.cz (ex)
V poslední dekádě bylo možné zaznamenat obrovský nárůst popularity strojového učení a zejména umělých neuronových sítí. Je to dáno především exponenciálním nárůstem dostupného výpočetního výkonu, který umožňuje trénování i velice komplexních sítí s hlubokou strukturou. Díky tomu je možné strojovým učením řešit úlohy, u kterých to dříve bylo nepředstavitelné. Jednou z nich je i plně automatické generování textů, které nevyžaduje žádnou explicitně definovanou slovní zásobu ani gramatiku.
V přednášce budou představeny principy algoritmů založených na hlubokých rekurentních neuronových sítích a Long-short Term Memory sítích, které stojí za vytvořením sbírky básní Poezie umělého světa. Jedná se o první knižně vydanou sbírku české poezie, která byla kompletně vygenerována počítačem.