Data a znalosti 2017

Program konference, Zvané přednášky (abstrakty), Registrace.

Program konference Data a znalosti 2017

Ke stažení: Program konference v PDF, Sborník konference Data a znalosti 2017

Čtvrtek 5. října 2017

8:00 – 12:00	Registrace účastníků konference
9:00 – 9:20	Zahájení konference: Josef Steinberger, Dalibor Fiala, Karel Ježek a zástupce katedry/fakulty
Zvané přednášky 1 (Předseda sekce: Josef Steinberger)
9:20 – 10:00	Sémantická analýza ve forenzním vyšetřování Kateřina Veselovská (Deloitte)
10:00 - 10:40	Data Science a umělá inteligence v O2 Jan Romportl (O2)
10:40 - 11:00	Přestávka s občerstvením
11:00 - 11:40	Moderní přístupy ke strojovému generování textů Jiří Materna (Machine learning guru)
Konferenční příspěvky (Předseda sekce: Ján Paralič)
11:40 - 12:30	SISel: Aviation Safety Powered by Semantic Technologies Martin Ledvinka, Petr Křemen, Bogdan Kostov a Miroslav Blaško OLAP Recommender: Supporting Navigation in OLAP Cubes Using Association Rule Mining Bohuslav Koukal, David Chudán a Vojtěch Svátek Interaktívna vizualizácia hierarchických štruktúr Miroslav Smatana a Peter Butka Information Extraction from the Web by Matching Visual Presentation Patterns Matej Minárik a Radek Burget Využití formálních gramatik v automatickém plánování - na cestě k sjednocujícímu modelu Roman Barták Využití EasyMiner API v projektu OpenBudgets.eu Stanislav Vojíř, Václav Zeman, Jaroslav Kuchař a Tomáš Kliegr
12:30 - 14:00	Oběd
Zvané přednášky 2 (Předseda sekce: Josef Steinberger)
14:00 - 14:40	Bot framework a Cognitive services aneb sestavte si vlastního inteligentního bota Lukáš Kohut (Microsoft)
14:40 - 15:20	Jak se pečou data v Socialbakers Milan Lepík (Socialbakers)
Upoutávky posterů (Předseda sekce: Dalibor Fiala)
15: 20 – 15:50	Efektivní analýza velkých dat pomocí Apache Spark a samoučících neuronových sítí na jediném počítači David Andrešič a Petr Šaloun Exploračná analýza medicínskych záznamov František Babič, Michal Vadovský a Ján Paralič UWB at SemEval 2014 and 2016 Tomáš Brychcín, Tomáš Hercig, Lukáš Svoboda a Michal Konkol Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí Přemysl Václav Duben a Stanislav Vojíř Získávání dat z bibliografických databází Dalibor Fiala Recommending News Articles using Rule-based Classifier Christián Golian a Jaroslav Kuchař Včasná identifikácia trendov v správaní používateľov elektronického zľavového portálu Ondrej Kaššák a Mária Bieliková Pokroky v analýze heterogenních neuroinformatických dat Ondřej Klempíř, Václav Čejka, Jan Tesař a Radim Krupička Data integration for customer preference learning Michal Kopecký, Marta Vomlelová a Peter Vojtáš Kripke style Dynamic model for Web Annotation with Similarity and Reliability Michal Kopecký, Marta Vomlelová a Peter Vojtáš Predikcia spotových cien elektriny Róbert Magyar a Viera Rozinajová Anotovanie slovníka pre analýzu sentimentu pomocou PSO Martin Mikula a Kristína Machová Porovnanie algoritmov na analýzu sekvencií pohľadu Róbert Móro, Michal Melúch, Martin Mokrý a Mária Bieliková Interaktívna vizualizácia výsledkov vyhľadávania informácií pomocou konceptových zväzov Veronika Novotná, Peter Butka a Miroslav Smatana Minimal Transportation Disruptions Model and Ontologies for Modelling of Disruptive Events Josef Petrák Towards User-friendly and High-performance Analytics with Big Data Historian Martin Possolt, Václav Jirkovský a Marek Obitko Projekt MONSOON – návrh platformy pre analýzu veľkých dát v priemysle Martin Sarnovský a Peter Bednár First Insight into the Processing of the Historical Documents from the Period of Totalitarian Regimes Lucie Skorkovská, Petr Neduchal, Zbyněk Zajíc, Pavel Ircing, Luděk Müller a Lukáš Bureš Hierarchické prístupy k modelovaniu témy v dokumentech Miroslav Smatana, Peter Butka a Matúš Gore Vyhľadávanie významných konceptov v rámci konceptuálnej analýzy dát Miroslav Smatana, Peter Butka a Zuzana Čabalová Analýza zpravodajských textů a jejich komentářů napříč jazyky Josef Steinberger Fokusovaná kategorizační síla webových ontologií Vojtěch Svátek, Ondřej Zamazal a Miroslav Vacura Ontology Learning for Facilitating Ontology Matching in Automotive Ondřej Šebek, Václav Jirkovský, Nestor Rychtyckyj a Petr Kadera Automatizace klasifikace evropských projektů pomocí klasifikátoru Ondřej Zamazal Univerzální řešení domén v relační databázi Martin Zíma, Michal Nykl a Martin Dostal
15:50 - 17:30	Postery s občerstvením
16:30 - 17:30	Schůze řídícího výboru
18:00 - 19:30	Exkurze do pivovaru Prazdroj (1. skupina 18:00 - 19:00, 2. skupina 18:15 - 19:15)
20:00 - 22:30	Společenský večer s rautem

Pátek 6. října 2017

Vybraný příspěvek (Předseda sekce: Karel Ježek)
9:00 – 9:40	Relační a NoSQL databáze: dvě strany téže mince? Jaroslav Pokorný
Doktorandské sympozium (Předseda sekce: Mária Bieliková)
9:40 – 11:00	Použitie spracovaných záznamov reči pacientov pre určenie štádia Parkinsonovej choroby Michal Vadovský a Ján Paralič Analýza dát za účelom zlepšenia konkrétneho procesu logistickej firmy Miroslava Muchová a Ján Paralič Procedurální znalosti expertů a model GLIF Ondřej Říha Personalizované odporúčanie využívajúce vizuálne stimuly Peter Gašpar, Michal Kompan a Mária Bieliková The agent-based model of the dynamic spectrum access networks based on the bilateral bargaining Marcel Vološin, Eugen Šlapak a Juraj Gazda Predikcia úpadku spoločností s ručením obmedzeným využitím metód pre rozpoznanie odľahlých bodov Peter Gnip, Martin Zoričák a Peter Drotár Detecting Anomalous Trajectories and Traffic Services Mazen Ismael Applying Trusted Knowledge in Evaluation Phase of Data Mining Viktor Nekvapil Učenie s prenosom medzi prirodzenými jazykmi Matúš Pikuliak, Marián Šimko a Mária Bieliková Smerom k automatickej detekcii problémov s použiteľnosťou prostredníctvom sledovania pohľadu Martin Svrček a Mária Bieliková
11:00 – 12:20	Postery s občerstvením
12:20 – 12:30	Zakončení konference
12:30 – 14:00	Oběd

Zvané přednášky (abstrakty)

Zvanou přednášku nám potvrdili:
Deloitte - Kateřina Veselovská,
O2 - Jan Romportl,
Microsoft - Lukáš Kohut,
Socialbakers - Milan Lepík,
Seznam.cz (ex) - Jiří Materna.

Kateřina Veselovská, Deloitte ČR

Sémantická analýza ve forenzním vyšetřování

Kateřina Veselovská
Semantic Data Science Lead, Analytic & Forensic Technology,
Deloitte ČR

Včasné vyhodnocení závažnosti případu a správná identifikace klíčových slov jsou v rámci forenzního vyšetřování dlouhodobě zásadními kompetencemi. Objem analyzovaných textových dat ale stále roste a častěji se také setkáváme s případy zahrnujícími data z mnoha různých jazyků. Tradiční přístupy k prohledávání dat zastarávají, ukazují se jako nákladné a nepraktické. Při hledání vzorců a trendů v datech již není možné spoléhat se výhradně na manuální analýzy. V tomto příspěvku ukážeme, jak využíváme nejnovější přístupy z oblasti počítačového zpracování přirozeného jazyka pro účely automatické analýzy nestrukturovaného obsahu a identifikaci vyhledávaných slov ve forenzní analytice, a uvedeme konkrétní příklady ilustrující úsporu času a nákladů při uplatnění sémantické analýzy ve forenzním vyšetřování.

Jan Romportl, O2 ČR

Data Science a umělá inteligence v O2

Jan Romportl
Chief Data Scientist,
O2 ČR

Data Science tým O2 pracuje nad rozsáhlými heterogenními zdroji dat, které integruje ve své Big Data platformě a která pokrývají poměrně široké spektrum od signalizací z mobilní sítě přes webový provoz, geolokační data, IPTV či zákaznické chování, až po různé druhy textových dat. Přednáška tedy nejprve stručně představí roli Data Science týmu uvnitř struktury O2 Czech Republic, dále podrobněji popíše konkrétní zdroje dat a platformy, s nimiž pracujeme, a pak se zaměří hlavně na metody, které nejčastěji používáme, jakou roli v nich hraje aplikovaná umělá inteligence, kde využíváme deep learning či kde je naopak nutno použít lineární, snadno interpretovatelné modely. Vzhledem k tomu, že přednáška proběhne mezi akademiky, tak se nebude moci vyhnout ani představení toho, jak v O2 využíváme metody strojového zpracování přirozeného jazyka. Na závěr přednáška zmíní, jak je to s bezpečností dat a ochranou citlivých informací.

Lukáš Kohut, Microsoft CEE

Bot framework a Cognitive services
aneb sestavte si vlastního inteligentního bota

Lukáš Kohut
ASSC Consultant,
Microsoft CEE

Microsoft investuje v poslední době nemalé finanční prostředky do rozvoje kognitivních služeb umožňujících rozvíjet umělou inteligenci v netradičních řešeních. Jedno z aktuálních témat dneška je využití umělé inteligence v podobě bota, který umožňuje vést konverzaci formou textu nebo hlasu. Díky spojení umělé inteligence a jakékoliv konverzační platformy se otevírají úplně nové možnosti, jak lze pomocí přirozeného jazyka lépe vyhledávat informace nebo řešit specifické úlohy. Cílem přednášky je představit kognitivní služby pracující s textovým obsahem a blíže si představit využití botů ve společnosti.

Milan Lepík, Socialbakers

Jak se pečou data v Socialbakers

Milan Lepík
Director of Data Platform,
Socialbakers

Socialbakers pomáhají firmám měřit úspěšnost na sociálních sítích jako Facebook, Twitter, Instagram či Youtube. Mezi zákazníky firmy patří polovina největších světových firem z žebříčku Fortune 500. Základem analýz jsou data. Každou vteřinu se odešle 1.000 požadavků na věřejně dostupná API sociálních sítí, takto získaná data jsou v systému dostupná okamžitě po uložení do databáze, včetně výsledku výpočtu agregací klíčových metrik. Fulltext hledání nad 1 miliardou příspěvků v clusteru se pohybuje pod 3s. Přednáška je zaměřená na popis silných a slabých stránek vyzkoušených databázových technologií z pohledu potřeb Socialbakers.

Jiří Materna, Seznam.cz (ex)

Moderní přístupy ke strojovému generování textů

Jiří Materna
Machine Learning Freelancer
Head of Research,
Seznam.cz (ex)

V poslední dekádě bylo možné zaznamenat obrovský nárůst popularity strojového učení a zejména umělých neuronových sítí. Je to dáno především exponenciálním nárůstem dostupného výpočetního výkonu, který umožňuje trénování i velice komplexních sítí s hlubokou strukturou. Díky tomu je možné strojovým učením řešit úlohy, u kterých to dříve bylo nepředstavitelné. Jednou z nich je i plně automatické generování textů, které nevyžaduje žádnou explicitně definovanou slovní zásobu ani gramatiku.
V přednášce budou představeny principy algoritmů založených na hlubokých rekurentních neuronových sítích a Long-short Term Memory sítích, které stojí za vytvořením sbírky básní Poezie umělého světa. Jedná se o první knižně vydanou sbírku české poezie, která byla kompletně vygenerována počítačem.