home

Sabtu, 27 Maret 2010

R’s Power


Untuk sebagian orang R adalah huruf ke-18 alfabet. Dan untuk sebagian orang juga ada yang bermasalah ketika mengucapkan kata yang ada huruf R. (termasuk saya sendiri).
R adalah nama sebuah bahasa pemrograman yang populer digunakan oleh banyak analis data di dalam perusahaan dan akademisi. Hal ini menjadi lingua franca mereka sebagian karena data mining telah memasuki zaman keemasan, apakah digunakan untuk menetapkan harga iklan, menemukan obat baru lebih cepat atau menyempurnakan model keuangan. Perusahaan beragam seperti Google, Pfizer, Merck, Bank of America, InterContinental Hotels Group dan Shell menggunakannya
Tapi R juga cepat menemukan karena mengikuti ahli statistik, insinyur dan ilmuwan tanpa keterampilan pemrograman komputer merasa mudah untuk digunakan
"R adalah benar-benar penting bagi titik yang sulit untuk menilai terlalu tinggi itu," kata Daryl Pregibon, seorang ilmuwan riset di Google, yang menggunakan perangkat lunak secara luas. "Hal ini memungkinkan ahli statistik untuk melakukan sangat rumit dan analisis rumit tanpa mengetahui darah dan nyali sistem komputasi."
“It is also free”. R adalah sebuah program sumber terbuka, dan popularitas mencerminkan pergeseran jenis perangkat lunak yang digunakan di dalam perusahaan. Perangkat lunak open source gratis untuk siapa saja untuk menggunakan dan memodifikasi. IBM, Hewlett-Packard dan Dell menghasilkan miliaran dolar per tahun menjual server yang menjalankan open-source sistem operasi Linux, yang bersaing dengan Windows dari Microsoft. Sebagian besar situs Web akan ditampilkan menggunakan sumber terbuka aplikasi bernama Apache, dan perusahaan-perusahaan semakin bergantung pada open-source database MySQL untuk menyimpan informasi penting mereka. Banyak orang melihat hasil akhir dari semua teknologi ini melalui browser Web Firefox, juga perangkat lunak sumber terbuka.
R adalah serupa dengan bahasa pemrograman lain, seperti C, Java dan Perl, dalam membantu orang melakukan berbagai tugas komputasi dengan memberikan mereka akses ke berbagai perintah. Untuk statistik Namun, R adalah sangat berguna karena mengandung sejumlah built-in mekanisme untuk mengorganisasi data, menjalankan perhitungan pada informasi dan menciptakan representasi grafis data set.
Beberapa orang akrab dengan R menggambarkannya sebagai versi supercharged spreadsheet Excel Microsoft perangkat lunak yang dapat membantu menjelaskan kecenderungan data yang lebih jelas daripada yang dimungkinkan dengan memasukkan informasi ke baris dan kolom.
Apa yang membuat R sangat berguna - dan membantu menjelaskan penerimaan cepat - adalah bahwa ahli statistik, insinyur dan ilmuwan dapat meningkatkan perangkat lunak kode atau variasi untuk menulis tugas-tugas tertentu. Paket ditulis untuk R menambahkan algoritma canggih, berwarna dan bertekstur grafik dan teknik pertambangan untuk menggali lebih dalam ke dalam database.
Dekat sampai 1,600 paket yang berbeda berada pada satu dari sekian banyak situs Web yang ditujukan untuk R, dan jumlah paket yang telah tumbuh secara eksponensial. Satu paket, yang disebut BiodiversityR, menawarkan antarmuka grafis ditujukan untuk membuat perhitungan tren lingkungan lebih mudah.
Paket lain, yang disebut Emu, menganalisa pola bicara, sedangkan GenABEL digunakan untuk mempelajari genom manusia.
Komunitas jasa keuangan telah menunjukkan afinitas tertentu untuk R; puluhan paket yang tersedia untuk analisis derivatif
"Keindahan besar R adalah bahwa Anda dapat mengubahnya untuk melakukan segala macam hal," kata Hal Varian, kepala ekonom di Google. "Dan Anda punya banyak hal yang dikemas sudah tersedia, sehingga Anda berdiri di bahu raksasa."
R pertama kali muncul pada tahun 1996, ketika profesor statistik Ross Ihaka dan Robert Gentleman dari University of Auckland di Selandia Baru dirilis kode sebagai paket perangkat lunak bebas.
Menurut mereka, gagasan merancang sesuatu seperti melompat R lorong selama percakapan. Mereka berdua ingin teknologi lebih cocok bagi siswa statistik mereka, yang diperlukan untuk menganalisis data dan menghasilkan model grafis informasi. Kebanyakan perangkat lunak sebanding telah dirancang oleh ilmuwan komputer dan terbukti sulit untuk digunakan.
Kurang dalam pelatihan ilmu komputer, para profesor dianggap sebagai upaya pengkodean mereka lebih dari permainan akademik daripada apa pun. Meskipun demikian, dimulai pada sekitar tahun 1991, mereka bekerja pada R penuh waktu. "Kami cukup banyak yang tidak terpisahkan selama lima atau enam tahun," kata Mr Gentleman. "Satu orang akan melakukan hal yang mengetik dan satu orang akan melakukan hal yang berpikir."
Beberapa ahli statistik yang mengambil asumsi awal melihat perangkat lunak menganggap kasar disalah satu sisi. Tetapi terlepas dari segala kekurangannya, R segera mendapatkan berikut dengan orang-orang yang melihat kemungkinan-kemungkinan dalam menyesuaikan perangkat lunak bebas.
John M. Chambers, mantan peneliti Bell Labs yang sekarang menjadi konsultan statistik profesor di Stanford University, adalah juara awal. Di Bell Labs, Mr Chambers telah membantu mengembangkan S, proyek perangkat lunak statistik lainnya, yang dimaksudkan untuk memberikan peneliti dari semua garis-garis sebuah alat analisis data yang dapat diakses. Meskipun demikian, bukan proyek sumber terbuka.
Perangkat lunak gagal untuk menghasilkan bunga yang luas dan akhirnya hak untuk S berakhir di tangan Tibco Software. Sekarang R adalah melebihi apa yang Mr Chambers telah membayangkan mungkin dengan S.
"Keragaman dan kegembiraan sekitar apa semua orang ini lakukan adalah hebat," kata Mr Chambers.



Tidak ada komentar: