Main Article Content

Abstract

Seiring dengan perkembangan berbagai bisnis proses, keberadaan data yang ada semakin berkembang dalam berbagai bentuk. Salah satu bentuk data adalah tabel di dalam sebuah halaman HTML. Berbeda dengan tabel pada database, tabel HTML memiliki struktur yang beragam. Nama atribut, pada tabel database selalu berada pada baris pertama. Sedangkan, pada tabel HTML, nama atribut dapat berada pada kolom pertama (row wise table) atau pada baris dan kolom pertama (column-row wise table). Sehingga, dalam proses ekstraksi, terlebih dahulu harus dikenali bagian pada tabel yang berperan sebagai nama kolom dan bagian tabel yang berperan sebagai data. Setelah diekstraksi, agar dapat digunakan untuk kebutuhan yang lebih lanjut, tabel HTML tersebut disimpan dalam sebuah database. Proses ini dilakukan dengan pendekatan Service Oriented Architecture sehingga ekstraksi dapat dilakukan secara otomatis. Penelitian ini mengembangkan sebuah model ekstraksi tabel HTML dengan pendekatan semantic tree dan memanfaatkan SOA dalam proses loading data ke database. Model yang dihasilkan berhasil mengekstrak tabel dari halaman web dengan 3 jenis bentuk layout, yaitu column wise, row wise, dan column-row wise dan menyimpannya dalam DBMS.

Article Details

How to Cite
Akbar, M., & Wibowo, A. (2017). Ekstraksi Tabel HTML ke Database Management System dengan Pendekatan Service Oriented Architecture. Jurnal Komputer Terapan, 3(2), 279–288. Retrieved from https://jurnal.pcr.ac.id/index.php/jkt/article/view/1565

References

  1. Thomas Erl, Service-Oriented Architecture:Comcepts, Technology, and Design.: Prentice Hall PTR, 2005.
  2. Bogdan Ghlicic Michu, Marian Stoica, and Marinela Mircea, "SOA, SoBI & EDA – Paradigms for Integration Capabilities of BI Platform," Revista Informatica Economică nr. 2, 2008.
  3. Yeon-Seok Kim and Kyong-Ho Lee, "Extracting logical structures from HTML tables," Computer Standards and Interfaces (Elsevier), vol. 30, no. 5, pp. 296-308, August 2007.
  4. Chen Kerui, Zhao Jinchao, Zuo Wanli, He Fengling, and Chen Yongheng, "Automatic table integration by domain-specific ontology," International Journal ofDigital Content Technology and Its Application, vol. 5, no. 1, pp. 218-226, January 2011.
  5. Goldstone, "Enterprise Application Integration - An Overview,".
  6. Florence Lin, "Enterprise Application Integration (EAI) Techniques," 2005.
  7. Michael Havey, Modeling Orchestration and Choreography in Service Oriented Architecture.: Packt Publishing, 2008.
  8. Gregor Hohpe and Boby Woolf, Enterprise Integration Pattern : Designing, Building, and Deploying Messaging Solution.: Addison Wesley, 2003.
  9. Mike Rosen, Orchestration or Choreography?: Wilton Consulting Group, 2008.

Most read articles by the same author(s)

1 2 > >>