Kalau pernah belajar video processing, pasti kenal yang namanya model Lucas-Kanade, yaitu persamaan yang digunakan untuk mengasumsikan pergerakan piksel (alias motion flow) di sepanjang frame video.
Nah, yang tadi pagi jadi pembicara di seminar tentang metode deteksi mobil adalah bapak doktor Takeo Kanade yang punya setengah model Lucas-Kanade itu. Karena menurut saya si bapak ini lumayan orang ngetop (setidaknya di dunia video processing :D ), jadilah saya dan seorang teman lab menghadiri seminar jauh-jauh ke kampus utama KAISTe, menghadiri seminar tentang seperti yang saya bilang tadi itu. Inti seminarnya adalah bagaimana metode yang dia gunakan untuk mendeteksi adanya apa yang oleh mata kita diidentifikasikan sebagai mobil (yakni ada rodanya, ada jendela, ada bentuk tertentu, dst) dari sebuah gambar. Walaupun hasilnya sangatlah lumayan mengagumkan, bagaimana si algoritma berhasil me-recognize (apa nih bahasa Indonesianya? menyadari?) semua mobil yang ada dalam satu gambar, walaupun ada beberapa mobil yg tertutup benda atau mobil lain (occluded... bahasa Indonesianya apa ya?), tetapi tetap saja penjelasan rumus matematiknya bikin saya ngantuk ^^;;;
Anyway, yang menarik bukannya itu sih. Ada beberapa hal yang buat saya cukup menarik perhatian. Pertama, waktu doski ngerjain disertasi doktornya tentang face recognition, tahun jaman kuda saya belum lahir, dia mesti merancang dan membuat sendiri semua peralatannya mulai dari kamera, port ke komputer, sampe ke programnya (*sembah-sembah*). Membuat kita berpikir, jaman sekarang mau riset tentang object detection di video terkompresi (macam MPEG-2 yang ada di DVD itu atau yg sekarang lagi ngetop H.264/AVC) semua sudah ada. Kamera digital banyak, program coding tinggal donlod, bingung nyari rumus tinggal ngGoogle... Orang2 jaman dahulu memang top markotop...
Kedua, ternyata doski muncul sesaat di film Surrogates :D jadi cameo sebagai salah satu narasumber tentang robotic (walaupun sebenarnya dia emang ahlinya). Dan dia bilang, filmnya gak begitu bagus.. hahahah... (speaking of Surrogates itu, padahal saya baru nonton minggu kemaren dan gak ngeh ada adegan si bapak Kanade -_-;;; ) (eh speaking of Surrogates itu lagi.. pas surrogates nya pada di-shut down, kok gak ada kejadian pesawat jatuh atau kereta api yang derailed ya? aneh bin ajahib...).
Ketiga, doski dengan bangganya mengaku sebagai satu2nya professor yang pernah muncul di Superbowl alias liga american football. Soale dia merancang sistem berjudul EyeVision, yaitu sistem yang menggunakan puluhan kamera video high resolution high zoom capacity yang dipasang di sekeliling lapangan football untuk membuat efek seperti di film Matrix (dan dia bilang dia belon pernah nonton Matrix... -_-), efek yang itu loh, yang pas orangnya ditembak, trus kameranya muterin si orang in slow motion. Tadi pagi itu saya baru tau bagaimana membuat efek seperti itu. Ternyata, di sekeliling si boga lakon di pasang ratusan kamera yang memotret gerakan si orang itu. Jadi, kalo gambar2 dari kamera2 itu digabung kita bisa bikin efek seakan2 kameranya bergerak memutari orang yang sedang diem. Nah, pak Kanade bikin sistem ini buat ngerekam di lapangan football, jadi klo di-replay kita bisa liat gerakan orang dari sisi lain, persis replay-nya game FIFA dari EA.
Keempat, ini tentang risetnya yang lain, tentang alignment (apa yah bahasa Indonesianya? uh, dari tadi banyak istilah2 yang susah di-Indonesia-kan) titik2 di wajah manusia, berkaitan dengan pergerakan wajah manusia. Jadi doski men-demo-kan aplikasi yang secara realtime bisa mendeteksi titik2 pada wajah manusia, misalnya hidung di mana, mata di mana, dagu di mana (dengan tingkat kedetilan yang tinggi, jadi misalnya di hidung ada 4 atau 5 titik alignment). Nah, dengan mendeteksi titik2 itu, dia bisa merekonstruksi wajah orang lain untuk bergerak sesuai dengan hasil alignment dari realtime detection itu. Di demonya, diperlihatkan bagaimana dia membuat wajah Obama bergerak-gerak sesuai dengan pergerakan wajahnya yang lagi bercakap-cakap dalam bahasa Jepun... top!!
Memang tidak salah, dia bilang, kalo mau bikin paper atau presentasi topik, bikinlah yang overwhelming, yang bikin orang mikir, ".. how can he do that??". Satu hal lagi, dia bilang, kalo kita bisa meyakinkan audience mengenai kerjaan kita, mereka gak bakal bertanya bagaimana metoda nya atau efisiensi atau kemampuannya. Instead, kerjaan kita memang bener2 oke kalo audience-nya bertanya, "berapa harganya?" :D cool...
Seminar berakhir jam setengah satu kurang. Mungkin saking ngetopnya doski, temen saya sampe nawarin, mo foto bareng gak? Heheh.. boleh juga, tapi ternyata tidak jadi :D
Sekarang saatnya kembali bekerja, biar bisa ada hasil seperti bapak Kanade... nuhun sensei udah datang jauh2 :)
Nah, yang tadi pagi jadi pembicara di seminar tentang metode deteksi mobil adalah bapak doktor Takeo Kanade yang punya setengah model Lucas-Kanade itu. Karena menurut saya si bapak ini lumayan orang ngetop (setidaknya di dunia video processing :D ), jadilah saya dan seorang teman lab menghadiri seminar jauh-jauh ke kampus utama KAISTe, menghadiri seminar tentang seperti yang saya bilang tadi itu. Inti seminarnya adalah bagaimana metode yang dia gunakan untuk mendeteksi adanya apa yang oleh mata kita diidentifikasikan sebagai mobil (yakni ada rodanya, ada jendela, ada bentuk tertentu, dst) dari sebuah gambar. Walaupun hasilnya sangatlah lumayan mengagumkan, bagaimana si algoritma berhasil me-recognize (apa nih bahasa Indonesianya? menyadari?) semua mobil yang ada dalam satu gambar, walaupun ada beberapa mobil yg tertutup benda atau mobil lain (occluded... bahasa Indonesianya apa ya?), tetapi tetap saja penjelasan rumus matematiknya bikin saya ngantuk ^^;;;
Anyway, yang menarik bukannya itu sih. Ada beberapa hal yang buat saya cukup menarik perhatian. Pertama, waktu doski ngerjain disertasi doktornya tentang face recognition, tahun jaman kuda saya belum lahir, dia mesti merancang dan membuat sendiri semua peralatannya mulai dari kamera, port ke komputer, sampe ke programnya (*sembah-sembah*). Membuat kita berpikir, jaman sekarang mau riset tentang object detection di video terkompresi (macam MPEG-2 yang ada di DVD itu atau yg sekarang lagi ngetop H.264/AVC) semua sudah ada. Kamera digital banyak, program coding tinggal donlod, bingung nyari rumus tinggal ngGoogle... Orang2 jaman dahulu memang top markotop...
Kedua, ternyata doski muncul sesaat di film Surrogates :D jadi cameo sebagai salah satu narasumber tentang robotic (walaupun sebenarnya dia emang ahlinya). Dan dia bilang, filmnya gak begitu bagus.. hahahah... (speaking of Surrogates itu, padahal saya baru nonton minggu kemaren dan gak ngeh ada adegan si bapak Kanade -_-;;; ) (eh speaking of Surrogates itu lagi.. pas surrogates nya pada di-shut down, kok gak ada kejadian pesawat jatuh atau kereta api yang derailed ya? aneh bin ajahib...).
Ketiga, doski dengan bangganya mengaku sebagai satu2nya professor yang pernah muncul di Superbowl alias liga american football. Soale dia merancang sistem berjudul EyeVision, yaitu sistem yang menggunakan puluhan kamera video high resolution high zoom capacity yang dipasang di sekeliling lapangan football untuk membuat efek seperti di film Matrix (dan dia bilang dia belon pernah nonton Matrix... -_-), efek yang itu loh, yang pas orangnya ditembak, trus kameranya muterin si orang in slow motion. Tadi pagi itu saya baru tau bagaimana membuat efek seperti itu. Ternyata, di sekeliling si boga lakon di pasang ratusan kamera yang memotret gerakan si orang itu. Jadi, kalo gambar2 dari kamera2 itu digabung kita bisa bikin efek seakan2 kameranya bergerak memutari orang yang sedang diem. Nah, pak Kanade bikin sistem ini buat ngerekam di lapangan football, jadi klo di-replay kita bisa liat gerakan orang dari sisi lain, persis replay-nya game FIFA dari EA.
Keempat, ini tentang risetnya yang lain, tentang alignment (apa yah bahasa Indonesianya? uh, dari tadi banyak istilah2 yang susah di-Indonesia-kan) titik2 di wajah manusia, berkaitan dengan pergerakan wajah manusia. Jadi doski men-demo-kan aplikasi yang secara realtime bisa mendeteksi titik2 pada wajah manusia, misalnya hidung di mana, mata di mana, dagu di mana (dengan tingkat kedetilan yang tinggi, jadi misalnya di hidung ada 4 atau 5 titik alignment). Nah, dengan mendeteksi titik2 itu, dia bisa merekonstruksi wajah orang lain untuk bergerak sesuai dengan hasil alignment dari realtime detection itu. Di demonya, diperlihatkan bagaimana dia membuat wajah Obama bergerak-gerak sesuai dengan pergerakan wajahnya yang lagi bercakap-cakap dalam bahasa Jepun... top!!
Memang tidak salah, dia bilang, kalo mau bikin paper atau presentasi topik, bikinlah yang overwhelming, yang bikin orang mikir, ".. how can he do that??". Satu hal lagi, dia bilang, kalo kita bisa meyakinkan audience mengenai kerjaan kita, mereka gak bakal bertanya bagaimana metoda nya atau efisiensi atau kemampuannya. Instead, kerjaan kita memang bener2 oke kalo audience-nya bertanya, "berapa harganya?" :D cool...
Seminar berakhir jam setengah satu kurang. Mungkin saking ngetopnya doski, temen saya sampe nawarin, mo foto bareng gak? Heheh.. boleh juga, tapi ternyata tidak jadi :D
Sekarang saatnya kembali bekerja, biar bisa ada hasil seperti bapak Kanade... nuhun sensei udah datang jauh2 :)
Comments
tapi reply itu artinya menjawab. pantesan aku binun baca cerita kamera di lapangan bola :D
gugling si bapak ah..
itu loh yg bikin binun hihihihi
Ada papernya mbah Kanade ga say ttg deteksi mobil dan ngatasi occlusion? Tolong dikirimin kalo ada ya