Selasa, 30 September 2014

[Mentor] NLP:reimplementasi algoritma spottingnya "dbpedia-spotlight" untuk pebahasa

Peb Aryan akan menjadi mentor untuk NLP dengan topik reimplementasi algoritma spottingnya "dbpedia-spotlight" untuk pebahasa. Lebih spesifik, pada bagian Aho-Corasick string matching. Tujuannya adalah untuk mempercepat entity resolution.

Kemampuan yang harus dimiliki oleh peserta adalah:
  • Python dasar
  • Algoritma dan struktur data
  • Mampu mencari informasi lewat search engine atau membaca dari ensiklopedia

Waktu pekerjaan adalah maksimum tiga bulan.

Untuk lisensi, apabila ada proyek baru, maka lisensi akan ikut dengan parent projectnya.

Selain itu, topik lain yang tersedia adalah simple question answering Bahasa Indonesia. Untuk referensi, dapat membaca quepy (menerjemahkan pertanyaan dari teks menjadi query sparql ke dbpedia). Pustaka yang digunakan adalah rdflib, nltk+pebahasa, whoosh.

Diskusi bisa dilakukan mulai bulan Oktober 2014. Pekerjaan bisa dimulai dari tanggal 13 Oktober 2014 sampai 19 Desember 2014.

Untuk informasi selengkapnya, silahkan menghubungi Peb Aryan lewat mailing list.

Tidak ada komentar:

Posting Komentar