Regular Expression (RegEx)
   

RegEx, singkatan dari Regular Expression, adalah teks yang menggambarkan pola pencarian untuk matching, locate, dan manipulasi teks. Konsep ini muncul pada tahun 1951, diformulasikan oleh matematikawan Stephen Cole Kleene dalam konteks bahasa formal. Regular Expression yang digunakan dalam ilmu komputer teoritis, pemrograman, pengembangan perangkat lunak, pengolah kata dan optimisasi mesin pencari. Regular Expression dapat digunakan untuk menggambarkan string dan jumlah string dalam bentuk logis umum untuk mencari, mengganti, memanipulasi, atau memproses lebih lanjut dalam dokumen, kode sumber, atau database.

Contoh: Dalam editor teks yang diaktifkan dengan regex, semua tautan yang terkandung dalam file HTML seharusnya ditampilkan. Jika ungkapan <a href=”[^”[*”[^>] *> dimasukkan ke dalam fungsi pencarian editor, semua tautan akan ditampilkan yang memiliki format biasa untuk tautan HTML. Istilah <a href = “. *?”. *?> melakukan tugas yang sama.

Apa Itu Regular Expression (RegEx)

Ahli logika dan matematika Stephen Kleene dianggap sebagai pendiri regex. Pada tahun 1956 ia menggunakan notasi jumlah reguler dalam esai tentang representasi peristiwa dalam jaringan saraf dan automata terbatas. Ini dan karya-karya lain saat ini adalah dasar-dasar mendasar dalam ilmu komputer teoretis. Regular Expression sekarang digunakan di berbagai bidang untuk menyederhanakan operasi, yang jika tidak, akan menjadi sangat padat karya dan menghabiskan waktu.

Regex dapat digunakan tergantung pada implementasinya dalam beberapa bahasa pemrograman, lingkungan dan editor teks, misalnya, dalam Perl, PHP, .NET atau JavaScript sebagai elemen perpustakaan. Atau di EditPad, Emacs dan Notepad ++ sebagai fungsi pencarian dan ganti dalam editor teks. Di Google Analytics, Regular Expression juga digunakan untuk memfilter sumber lalu lintas, menentukan segmen, dan memisahkan data laporan terperinci dari data lain.

Kegunaan Regular Expression (RegEx)

Penggunaan regex sangat beragam. Regular Expression yang mungkin tergantung pada notasi. Ada beberapa notasi yang berbeda dalam bahasa pemrograman yang berbeda. Notasi ini disebut nama pola shell, BRE (Basic Regular Expressions) dan ERE (Extended Regular Expressions). Perbedaannya kadang-kadang disebabkan oleh fakta bahwa masing-masing karakter dan terutama metakarakter (karakter kontrol) digunakan dalam bahasa pemrograman.

Secara umum, karakter (terminal) dan karakter meta dibedakan. Karakter direkam dalam rangkaian karakter (alfabet) yang berisi, misalnya, angka, huruf, dan koma. Metakarakter adalah operasi yang ditentukan seperti pergantian |, menautkan () dan [] dan mengulangi dengan *, + dan ?. Dengan ^ jumlah bisa dinegasikan. Metakarakter adalah instruksi untuk perangkat lunak pemrosesan. Karakter biasa dapat berada di depan atau di belakang metakarakter, makna formal mereka akan berbeda. Sebagian besar implementasi bekerja dengan mesin regex khusus yang mem-parsing dan menafsirkan Regular Expression yang terdaftar dan memeriksa sumber daya untuk instance.

  • Karakter biasa: Semua angka dari 0 hingga 9. Semua huruf alfabet, dan beberapa karakter khusus (koma, tanda hubung, titik koma). Penting: Alfabet tergantung pada set karakter yang digunakan (misalnya, Unicode atau ASCII).
  • Kelas karakter: \ d adalah, misalnya, angka dari 1 hingga 9. Sementara \ t akan menemukan semua tabulator. Pilihan lain adalah \ l untuk huruf kecil, \ untuk semua spasi atau \ u untuk semua huruf besar.
  • Metakarakter:  [] () {} | ? + – * ^ $ \

Dengan garis miring terbalik yang diatur sebelumnya, metacharacter dapat dibatalkan.

Relevansi praktis Regular Expression (RegEx)

Metode berikut dapat diterapkan dengan Regular Expression:

Pencocokan pola: Dengan menggunakan algoritma pencocokan string, teks dapat diperiksa untuk terjadinya pola. Dalam hal ini, Regular Expression adalah singkatan dari serangkaian string dengan kemunculannya yang direkonsiliasi dalam teks. Ekspresi regex menentukan pola, mesin memeriksa pola terhadap sumber daya (misalnya, dokumen HTML atau teks). Dalam keadaan tertentu, aturan penggantian dapat ditentukan untuk secara langsung mengubah string yang ditemukan. Pengukur dapat digunakan untuk mempersempit hasil. Contoh: verifikasi alamat email yang dimasukkan mengenai kebenaran formalnya, atau pencarian domain tingkat atas dalam daftar URL.

Globbing: Nama file ditambahkan ke placeholder untuk memilih semua file dalam format tertentu, misalnya. “Sampel. * Wildcard akan menemukan semua file dalam sistem manajemen file yang dimulai dengan” sampel, “tetapi format file yang berbeda seperti .txt. atau .doc. Tanda bintang mewakili berbagai format file. Globbing juga digunakan dalam penolakan serangan layanan di mana server sengaja kelebihan beban.

Pemotongan: Dalam pencarian basis data, istilah pencarian sering disingkat atau dipotong menggunakan wildcard. Istilah sampel * akan menemukan semua istilah yang dimulai dengan sampel dan diakhiri dengan huruf lain, seperti, pencocokan sampel, pengujian sampel atau contoh sampel. Dengan pemotongan, ruang pencarian diperbesar. Contoh: Dalam pencarian perpustakaan, semua entri dapat ditemukan yang mengandung istilah pencarian tertentu.

Stemming: Dalam stemming, varian morfologis yang berbeda dari suatu kata dikaitkan dengan kata stem. Dengan demikian penolakan dan konjugasi kata-kata dapat terjadi.

Kesimpulan

Regular Expression adalah urutan karakter khusus yang membentuk pola pencarian. Dengan sintaksis yang canggih, regex memungkinkan pengguna untuk menggambarkan pola string dengan presisi tinggi, memungkinkan pencocokan kompleks, validasi input, dan manipulasi teks yang efisien. Penerapan regex melibatkan pencarian dan manipulasi string dalam dokumen, kode sumber, atau database. Kemampuannya untuk mengidentifikasi dan memanipulasi data berdasarkan pola tertentu membuatnya penting dalam pengembangan perangkat lunak, analisis teks, dan pengoptimalkan mesin pencari. Dengan regex, pengguna dapat melakukan pencarian, penggantian, dan pemrosesan string dengan tingkat akurasi dan kecepatan yang tinggi, memperluas fungsionalitas dalam berbagai konteks komputasi dan pemrograman.

Tag: , , , ,

Diposting oleh hestanto


Leave a Comment

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *