Kenapa Tulisan di Excel Terlihat Sama Tapi Dianggap Berbeda?
Pernah mengalami kasus seperti ini di Excel?
DANA
DANA
Secara visual terlihat identik. Tetapi saat:
filter,
pivot,
VLOOKUP,
atau remove duplicates,
hasilnya malah dianggap berbeda.
Kalau pernah, berarti kamu sedang berhadapan dengan “invisible character”.
Penyebab Utamanya
Dalam dunia data, sebuah teks bisa mengandung karakter tersembunyi seperti:
TAB (
CHAR(9))Non-breaking space (
CHAR(160))Line break (
CHAR(10))Karakter hasil copy dari website atau aplikasi tertentu
Karakter-karakter ini tidak terlihat oleh mata manusia, tetapi tetap dibaca oleh Excel.
Akibatnya:
data tidak matching,
duplicate tidak terbaca,
formula gagal,
dashboard menjadi tidak akurat.
Formula Ampuh untuk Membersihkan Data Excel
Berikut formula yang sangat berguna untuk standardisasi text:
=UPPER(TRIM(CLEAN(SUBSTITUTE(SUBSTITUTE(I2,CHAR(160)," "),CHAR(9)," "))))
Penjelasan Formula
1. UPPER()
Mengubah semua huruf menjadi kapital.
Contoh:
facebook → FACEBOOK
2. TRIM()
Menghapus:
spasi depan,
spasi belakang,
dan double space.
3. CLEAN()
Menghapus karakter non-printable atau invisible character.
4. SUBSTITUTE(...CHAR(160)...)
Membersihkan non-breaking space.
Karakter ini sering muncul dari:
copy website,
PDF,
export aplikasi.
5. SUBSTITUTE(...CHAR(9)...)
Menghapus karakter TAB.
Biasanya muncul dari:
copy tabel,
export CSV,
hasil paste dari system.
Kenapa Data Cleaning Sangat Penting?
Banyak orang menganggap data cleaning hal sepele.
Padahal dalam pekerjaan nyata:
analyst,
engineer,
finance,
marketing,
telecom,
hingga AI processing,
sebagian besar error justru berasal dari data yang “kotor”.
Karena itu ada prinsip penting:
Garbage In = Garbage Out
Kalau datanya tidak bersih, hasil analisis pun akan bermasalah.
Tips Tambahan untuk Debugging
Kalau ingin mengecek apakah text benar-benar sama, gunakan:
=LEN(A1)
atau:
=EXACT(A1,A2)
Ini membantu mendeteksi karakter tersembunyi yang sulit terlihat.
Penutup
Skill membersihkan data adalah salah satu kemampuan paling underrated di dunia kerja digital.
Kadang satu formula sederhana bisa menghemat:
jam kerja,
error report,
bahkan keputusan bisnis yang salah.
Dan salah satu formula favorit untuk itu adalah:
=UPPER(TRIM(CLEAN(SUBSTITUTE(SUBSTITUTE(I2,CHAR(160)," "),CHAR(9)," "))))
Simple, tapi sangat powerful.
Silahkan berkomentar yang baik di sini :) (no junk)