tujuan
Untuk memungkinkan sebuah "perusahaan" * untuk meningkatkan melalui pemahaman yang lebih baik dari .......nya.
Potensi untuk Keunggulan Kompetitif
Untuk memungkinkan sebuah "perusahaan" * untuk meningkatkan melalui pemahaman yang lebih baik dari .......nya.
Potensi untuk Keunggulan Kompetitif
Yayasan Data Mining
Data mining adalah proses menggunakan "mentah" data untuk menyimpulkan penting "bisnis" hubungan.
Meskipun konsensus pada nilai data mining, banyak kebingungan ada tentang apa itu.
Data Mining adalah kumpulan teknik yang kuat dimaksudkan untuk menganalisis sejumlah besar data.
Tidak ada data tunggal pendekatan pertambangan, melainkan satu set teknik yang dapat digunakan berdiri sendiri atau dalam kombinasi dengan satu sama lain.
Data mining adalah proses menggunakan "mentah" data untuk menyimpulkan penting "bisnis" hubungan.
Meskipun konsensus pada nilai data mining, banyak kebingungan ada tentang apa itu.
Data Mining adalah kumpulan teknik yang kuat dimaksudkan untuk menganalisis sejumlah besar data.
Tidak ada data tunggal pendekatan pertambangan, melainkan satu set teknik yang dapat digunakan berdiri sendiri atau dalam kombinasi dengan satu sama lain.
Data Mining - Kenapa sekarang?
1 Data sedang diproduksi
2 Data sedang warehoused
3 Daya komputasi yang lebih terjangkau
4 Tekanan kompetitif sangat besar
5 Data Mining lunak tersedia
1 Data sedang diproduksi
2 Data sedang warehoused
3 Daya komputasi yang lebih terjangkau
4 Tekanan kompetitif sangat besar
5 Data Mining lunak tersedia
Customer
Relationship Management (CRM)
Dalam rangka untuk membentuk hubungan belajar dengan pelanggan, suatu perusahaan (perusahaan) harus mampu:
Perhatikan - apa yang pelanggan lakukan
Ingat - apa itu dan pelanggan telah dilakukan dari waktu ke waktu
Pelajari - dari apa yang telah mengingat
Undang-Undang Di - apa yang telah belajar untuk membuat pelanggan lebih menguntungkan
Dalam rangka untuk membentuk hubungan belajar dengan pelanggan, suatu perusahaan (perusahaan) harus mampu:
Perhatikan - apa yang pelanggan lakukan
Ingat - apa itu dan pelanggan telah dilakukan dari waktu ke waktu
Pelajari - dari apa yang telah mengingat
Undang-Undang Di - apa yang telah belajar untuk membuat pelanggan lebih menguntungkan
Topics
to Discuss in Session #2
•
Data Mining History
Pendekatan ini
memiliki akar dalam praktek dating kembali lebih dari 40 tahun.
Pada awal 1960-an, data mining disebut analisis statistik, dan pelopor adalah perusahaan perangkat lunak statistik seperti SAS dan SPSS.
Pada akhir 1980-an, teknik tradisional telah ditambah dengan metode baru seperti logika fuzzy, heuristik dan jaringan saraf.
Pada awal 1960-an, data mining disebut analisis statistik, dan pelopor adalah perusahaan perangkat lunak statistik seperti SAS dan SPSS.
Pada akhir 1980-an, teknik tradisional telah ditambah dengan metode baru seperti logika fuzzy, heuristik dan jaringan saraf.
•
Data Warehouse
Sebuah data
warehouse adalah salinan data transaksi khusus yang terstruktur untuk query,
analisis dan pelaporan - maka, data mining.
Perhatikan bahwa data warehouse berisi salinan transaksi yang tidak diperbaharui atau diubah kemudian oleh sistem transaksi.
Juga perhatikan bahwa data ini secara khusus terstruktur, dan mungkin telah berubah ketika disalin ke dalam gudang data.
Perhatikan bahwa data warehouse berisi salinan transaksi yang tidak diperbaharui atau diubah kemudian oleh sistem transaksi.
Juga perhatikan bahwa data ini secara khusus terstruktur, dan mungkin telah berubah ketika disalin ke dalam gudang data.
•
Data Mart
Sebuah Data
Mart adalah, lebih kecil lebih terfokus Data Warehouse - mini-gudang.
Sebuah Data Mart biasanya mencerminkan aturan bisnis dari sebuah unit bisnis tertentu dalam perusahaan.
Sebuah Data Mart biasanya mencerminkan aturan bisnis dari sebuah unit bisnis tertentu dalam perusahaan.
Topics
to Discuss in Session #3
•
Data Mining Flavors
Sutradara -
Upaya untuk menjelaskan atau mengkategorikan beberapa bidang sasaran tertentu
seperti pendapatan atau respon.
Diarahkan - Upaya untuk menemukan pola atau kesamaan antara kelompok-kelompok catatan tanpa menggunakan bidang target tertentu atau koleksi kelas standar.
Diarahkan - Upaya untuk menemukan pola atau kesamaan antara kelompok-kelompok catatan tanpa menggunakan bidang target tertentu atau koleksi kelas standar.
•
Data Mining Examples
Pemerintah AS
FBI - melacak penjahat (SD Polisi juga)
Treasury Dept - transfer dana mencurigakan int'l
perusahaan telepon
Supermarket & Superstore (Vons, Albertsons, Wal-Mart, Costco)
Mail-Order, On-Line Order (LL Bean, Victoria Secret, Lands End)
Lembaga Keuangan (BoA, Wells Fargo, Charles Schwab)
Perusahaan Asuransi (USAA, Allstate, State Farm)
Ton orang lain ...
FBI - melacak penjahat (SD Polisi juga)
Treasury Dept - transfer dana mencurigakan int'l
perusahaan telepon
Supermarket & Superstore (Vons, Albertsons, Wal-Mart, Costco)
Mail-Order, On-Line Order (LL Bean, Victoria Secret, Lands End)
Lembaga Keuangan (BoA, Wells Fargo, Charles Schwab)
Perusahaan Asuransi (USAA, Allstate, State Farm)
Ton orang lain ...
•
Data Mining Tasks
Klasifikasi - contoh: Romo, Jadi, Jr, Sr
Estimasi - contoh: pendapatan rumah tangga
Prediksi - contoh: memprediksi kartu kredit saldo rata-rata jumlah transfer
Pengelompokan Affinity - Contoh: orang yang membeli X, sering membeli Y juga dengan% probabilitas Z
Clustering - mirip dengan klasifikasi namun tidak ada kelas standar
Deskripsi dan Profil - melahirkan perilaku penjelasan seperti "orang Lebih suka Di-n-Out Burger daripada gals."
Estimasi - contoh: pendapatan rumah tangga
Prediksi - contoh: memprediksi kartu kredit saldo rata-rata jumlah transfer
Pengelompokan Affinity - Contoh: orang yang membeli X, sering membeli Y juga dengan% probabilitas Z
Clustering - mirip dengan klasifikasi namun tidak ada kelas standar
Deskripsi dan Profil - melahirkan perilaku penjelasan seperti "orang Lebih suka Di-n-Out Burger daripada gals."
•
Data Mining’s Biggest Challenge
Tantangan terbesar seorang penambang data
yang mungkin dihadapi adalah jumlah data
dalam data warehouse.
Hal ini sangat penting, maka, bahwa data ringkasan juga tersedia untuk mendapatkan analisis dimulai.
Masalah utama adalah bahwa ini volume tipis dapat menutupi hubungan penting penambang data tertarik
Kemampuan untuk mengatasi volume dan dapat menafsirkan data yang cukup penting.
Hal ini sangat penting, maka, bahwa data ringkasan juga tersedia untuk mendapatkan analisis dimulai.
Masalah utama adalah bahwa ini volume tipis dapat menutupi hubungan penting penambang data tertarik
Kemampuan untuk mengatasi volume dan dapat menafsirkan data yang cukup penting.
•
What does all of this mean?
Pada secara
teratur, "petani" dan "penjelajah" memanfaatkan gudang data
mereka untuk memberikan bimbingan untuk dan / atau menjawab berbagai pertanyaan
terbatas.
Tidak ada yang gratis, namun, dan manfaat yang datang dengan biaya.
Nilai dari sebuah gudang data dan selanjutnya data mining adalah hasil dari proses bisnis baru dan yang diubah itu memungkinkan - keunggulan kompetitif juga.
Ada keterbatasan, meskipun - Sebuah Gudang Data tidak dapat memperbaiki masalah dengan data, meskipun mungkin membantu untuk lebih jelas mengidentifikasi mereka.
Tidak ada yang gratis, namun, dan manfaat yang datang dengan biaya.
Nilai dari sebuah gudang data dan selanjutnya data mining adalah hasil dari proses bisnis baru dan yang diubah itu memungkinkan - keunggulan kompetitif juga.
Ada keterbatasan, meskipun - Sebuah Gudang Data tidak dapat memperbaiki masalah dengan data, meskipun mungkin membantu untuk lebih jelas mengidentifikasi mereka.
The Virtuous Cycle of Data Mining
Data @ jantung
dari proses bisnis perusahaan yang paling 'inti
Data yang dihasilkan oleh transaksi terlepas dari industri (ritel, asuransi ...)
Selain itu data internal, ada ton sumber data eksternal (peringkat kredit, demografi, dll)
Janji Data Mining adalah untuk menemukan pola dalam "gazillions" byte
Data yang dihasilkan oleh transaksi terlepas dari industri (ritel, asuransi ...)
Selain itu data internal, ada ton sumber data eksternal (peringkat kredit, demografi, dll)
Janji Data Mining adalah untuk menemukan pola dalam "gazillions" byte
Tetapi
Menemukan pola
tidak cukup
Bisnis (individu) harus:
-Menanggapi pola (s) dengan mengambil tindakan
-Menghidupkan:
*Data ke Informasi
*Informasi ke Aksi
*Aksi ke Nilai
Oleh karena itu, Siklus budiman DM
Bisnis (individu) harus:
-Menanggapi pola (s) dengan mengambil tindakan
-Menghidupkan:
*Data ke Informasi
*Informasi ke Aksi
*Aksi ke Nilai
Oleh karena itu, Siklus budiman DM
Data Mining ...
Mudah?
Literatur pemasaran membuatnya tampak mudah!
Hanya menerapkan algoritma otomatis dibuat oleh pikiran besar, seperti:
jaringan saraf
pohon keputusan
algoritma genetik
"Poof" ... keajaiban terjadi!
Tidak Jadi ... Data Mining adalah iteratif, proses pembelajaran
DM mengambil teliti, jangka panjang kerja keras dan komitmen
Reward DM itu: Sukses mengubah perusahaan dari reaktif menjadi proaktif
Literatur pemasaran membuatnya tampak mudah!
Hanya menerapkan algoritma otomatis dibuat oleh pikiran besar, seperti:
jaringan saraf
pohon keputusan
algoritma genetik
"Poof" ... keajaiban terjadi!
Tidak Jadi ... Data Mining adalah iteratif, proses pembelajaran
DM mengambil teliti, jangka panjang kerja keras dan komitmen
Reward DM itu: Sukses mengubah perusahaan dari reaktif menjadi proaktif
Data Mining
yang budiman Siklus
Identifikasi peluang bisnis *
Data mining untuk mengubahnya menjadi informasi bermanfaat
Bertindak berdasarkan informasi yang
Mengukur hasil
Identifikasi peluang bisnis *
Data mining untuk mengubahnya menjadi informasi bermanfaat
Bertindak berdasarkan informasi yang
Mengukur hasil
1)Mengidentifikasi Peluang Bisnis
-Banyak proses bisnis adalah kandidat yang baik:
Pengenalan produk baru
Langsung kampanye pemasaran
Memahami gesekan pelanggan / churn
Mengevaluasi hasil tes pasar
-Pengukuran dari upaya DM masa lalu:
Apa jenis pelanggan menanggapi kampanye terakhir kita?
Di mana pelanggan terbaik hidup?
Apakah lama menunggu di check-out garis penyebab gesekan pelanggan?
Produk apa yang harus dipromosikan dengan produk XYZ kita?
-TIP: Ketika berbicara dengan pengguna bisnis mengenai peluang data mining, pastikan Anda berfokus pada masalah bisnis / peluang dan bukan pada teknologi dan algoritma.
-Banyak proses bisnis adalah kandidat yang baik:
Pengenalan produk baru
Langsung kampanye pemasaran
Memahami gesekan pelanggan / churn
Mengevaluasi hasil tes pasar
-Pengukuran dari upaya DM masa lalu:
Apa jenis pelanggan menanggapi kampanye terakhir kita?
Di mana pelanggan terbaik hidup?
Apakah lama menunggu di check-out garis penyebab gesekan pelanggan?
Produk apa yang harus dipromosikan dengan produk XYZ kita?
-TIP: Ketika berbicara dengan pengguna bisnis mengenai peluang data mining, pastikan Anda berfokus pada masalah bisnis / peluang dan bukan pada teknologi dan algoritma.
2)Data mining untuk mengubahnya
menjadi informasi bermanfaat
-Sukses adalah masuk akal bisnis data
-Berbagai data "masalah":
-Bad format data (alpha numerik vs, hilang, nol, data yang palsu)
-Membingungkan bidang data (sinonim dan perbedaan)
-Kurangnya fungsi ("Aku berharap aku bisa ...")
-Hukum konsekuensi (privasi, dll)
-Organisasi faktor (tidak mau berubah "cara kita")
-Kurangnya ketepatan waktu
-Sukses adalah masuk akal bisnis data
-Berbagai data "masalah":
-Bad format data (alpha numerik vs, hilang, nol, data yang palsu)
-Membingungkan bidang data (sinonim dan perbedaan)
-Kurangnya fungsi ("Aku berharap aku bisa ...")
-Hukum konsekuensi (privasi, dll)
-Organisasi faktor (tidak mau berubah "cara kita")
-Kurangnya ketepatan waktu
3. Bertindak
atas Informasi
-Ini adalah tujuan dari Data Mining - dengan harapan nilai tambah
-Apa jenis tindakan?
Interaksi dengan pelanggan, prospek, pemasok
Memodifikasi prosedur pelayanan
Mengatur tingkat persediaan
konsolidasi
memperluas
Dll ...
-Ini adalah tujuan dari Data Mining - dengan harapan nilai tambah
-Apa jenis tindakan?
Interaksi dengan pelanggan, prospek, pemasok
Memodifikasi prosedur pelayanan
Mengatur tingkat persediaan
konsolidasi
memperluas
Dll ...
4. Mengukur
Hasil
-Menilai dampak dari tindakan yang dilakukan
-Sering diabaikan, diabaikan, dilewati
-Perencanaan untuk pengukuran harus dimulai ketika menganalisis peluang bisnis, bukan setelah itu adalah "seluruh"
-Penilaian pertanyaan (contoh):
Apakah ini kampanye ____ melakukan apa yang kita harapkan?
Apakah beberapa tawaran bekerja lebih baik daripada yang lain?
Apakah pelanggan ini membeli produk tambahan?
-Menilai dampak dari tindakan yang dilakukan
-Sering diabaikan, diabaikan, dilewati
-Perencanaan untuk pengukuran harus dimulai ketika menganalisis peluang bisnis, bukan setelah itu adalah "seluruh"
-Penilaian pertanyaan (contoh):
Apakah ini kampanye ____ melakukan apa yang kita harapkan?
Apakah beberapa tawaran bekerja lebih baik daripada yang lain?
Apakah pelanggan ini membeli produk tambahan?