Inferensial Analisis Jaringan Dengan Eksponensial
Friday, September 11, 2020
Edit
Inferensial Analisis Jaringan dengan eksponensial Acak
1. Pengantar
Selama beberapa dekade terakhir, para ilmuwan politik telah semakin tampak data relasional umumnya dan jaringan data specically untuk menjawab pertanyaan substantif penting. Namun, alat statistik untuk analisis data jaringan tidak terus berpacu dengan luas dan kompleksitas pertanyaan substantif yang diminta dari data tersebut. Karena metode yang sanggup menampung saling ketergantungan yang kompleks belum tersedia, telah menjadi lumrah di banyak sub_elds ilmu politik untuk memakai alat statistik tradisional, menyerupai sebagai model linear umum, data jaringan. Pendekatan menyerupai selalu menghasilkan biasa hasil alasannya struktur proses menghasilkan data yang tidak sanggup dimodelkan dengan alat yang menganggap kemerdekaan bersyarat pengamatan. Lebih jelek lagi, e_ects termodelkan dari struktur jaringan akan palsu dikaitkan dengan kovariat; sehingga makin meningkatkan-masalah yang kemampuan inferensi rusak. Meskipun ada beberapa pendekatan yang berkhasiat untuk menganalisis relasional data, kita membahas area perhatian khusus bagi para ilmuwan politik: bagaimana menciptakan berisi kesimpulan perihal e_ects kovariat, dan bahkan memperhitungkan interdependen- diktatorial kompleks lembaga-, ketika menganalisis jaringan politik. Tujuan kami di sini yaitu untuk memperkenalkan dan memperbaiki sebuah model untuk inferensi data jaringan disebut Model Exponential Acak Grafik (ERGM) sedemikian rupa untuk membuatnya secara luas berkhasiat untuk para ilmuwan politik. Kami empat bantuan yang bahwa kami memperkenalkan ERGM dan mendiskusikan beberapa duduk kasus yang dikala ini diterapkan membatasi nya utilitas peneliti substantif, mengembangkan ajaran untuk menganalisis yang sangat padat dan jarang jaringan dengan ERGM, o_er solusi untuk ketidakmampuan dikala ERGMs untuk model bujur gitudinally diamati jaringan, dan memperlihatkan dengan cara pola jaringan inferensi memakai ERGMs tidak hanya sanggup menghindari kesimpulan yang salah pada kovariat, namun sanggup memperlihatkan wawasan gres ke duduk kasus substantif.
Eksponensial model grafik acak (ERMG), telah berkembang dari serangkaian e_orts oleh
statistik dan sosiolog untuk mengatasi keterbatasan yang sama dari model statistik klasik yang telah frustrasi ilmuwan politik dengan memakai jaringan data. Dasar-dasar teoritis untuk ERGM awalnya diletakkan oleh Besag}) yang mengambarkan bahwa ada kelas distribusi probabilitas yang konsisten dengan properti Markov yang nilai dari satu lokasi tergantung hanya pada nilai-nilai tetangga bersebelahan nya. Bangunan on}) pekerjaan Besag itu, Belanda dan Leinhardt ??) berasal keluarga eksponensial distribusi untuk jaringan. Pada tahun yang sama, Fienberg dan Wasserman A981) menempatkan paparan yang keluarga nential model dalam konteks model log-linear dan diperiksa duduk kasus dengan estimasi kemungkinan model tersebut. Kelas ini model dan estimasi menyertai teknik yang dikembangkan lebih lanjut oleh Frank dan Strauss †) dan Strauss dan Ikeda) tapi tidak hingga Wasserman dan Pattison Ž) yang sepenuhnya umum ERGM yaitu _rst berasal.
Dalam bentuk yang paling sederhana, yang ERGM memperlihatkan semacam umum yang sama inferensi yang
ilmu politik terbiasa: variabel hasil diprediksi oleh beberapa independen variabel, hanya ada asumsi kemerdekaan diperlukan. Bayangkan variabel hasil menarik yaitu korelasi aliansi antara kedua negara. Daripada mengasumsikan bahwa setiap negara memutuskan yang independen portofolio aliansi dari semua keputusan lain yang dibuat oleh semua negara-negara lain dan yang keputusan dalam portofolio aliansi suatu negara yang independen, ERGM menganggap jaringan korelasi aliansi, model probabilitas mengamati jaringan yang di atas yang lain jaringan kita bisa mengamati, dan memungkinkan analis untuk menarik kesimpulan tergantung pada korelasi diad dalam jaringan. Dalam kata lain, ERGM memungkinkan peneliti untuk melaksanakan analisis longgar menyerupai dengan regresi logistik pada data jaringan, tetapi di samping pemodelan e_ects kovariat, mereka sanggup mengambil sebanyak ketergantungan jaringan memperhitungkan alasannya mereka melihat secara teoritis atau empiris 't. Alat yang ampuh dan fleksibel ini sangat gampang untuk memahami {meskipun mengharuskan kita untuk berpikir dengan cara yang mendasar di_erent perihal 1 Speci_cally, Besag}) mengambarkan Hammersley-Cli_ord Teorema yang memperlihatkan ini dalam konteks data spasial, tetapi teorema yang secara alami digeneralisasi untuk jaringan.
struktur data {dan alasannya sudah didukung oleh perangkat lunak, itu juga cukup gampang menggunakan. The ERGM adalah, menyerupai yang kita akan menunjukkan, luas berlaku untuk analisis relasional di politik sains dan sangat fleksibel dalam kemampuannya untuk model jaringan yang kompleks. Meskipun kerangka umum untuk ERGMs telah dikembangkan, ada tetap sejumlah duduk kasus yang dikala ini diterapkan membatasi kegunaan ERGMs bagi para ilmuwan politik, Kepala di antara yang ketidakmampuan mereka untuk model jaringan longitudinal diamati dan coding tantangan yang sanggup mengubah makna substantif hasil ERGM. Kami mengusulkan solusi
untuk duduk kasus ini masing-masing dan memperlihatkan e_cacy mereka dengan data ilmu politik dari Politik Amerika dan korelasi internasional.
Kami bukan _rst telah memperhatikan bahwa memperlakukan data relasional sebagai independen yaitu praktek bermasalah. Teori kualitatif dalam banyak sekali sub_elds telah membahas saling ketergantungan dence korelasi selama beberapa waktu dan teknik deskriptif untuk jaringan data kini cukup terkenal. Sedangkan disiplin secara keseluruhan belum menjauh dari regresi
data jaringan, banyak karya baru-baru ini telah berusaha untuk mengikuti keadaan model regresi dengan net- Kerangka kerja (Baybeck dan Huckfeldt 2002; Crescenzi 2007; Fowler 2006; Franzese dan
Hays 2006; Lazer 2005; Maoz et al. 2006; Maoz 2009; Schneider et al. 2003; Scholz dan Wang 2006; Ward dan Ho_ 2007; Ahlquist dan Ward 2009). Kebanyakan e_orts untuk memperpanjang kerangka regresi dengan konteks jaringan telah melibatkan dimasukkannya statistik jaringan sebagai kovariat dalam analisis regresi. Sebagai salah satu contoh, Maoz )
model kejadian angka dua-tingkat conict, serta jumlah agregat tahunan perselisihan antar dari militer, sebagai fungsi dari karakteristik dari perdagangan internasional dan jaringan aliansi. Juga, Maoz et al. _) Menghitung nilai kesetaraan struktural untuk setiap angka dua dalam jaringan dan termasuk yang diestimasi sebagai kovariat dalam regresi logistik dari conict internasional. Pendekatan ini ke jaringan modeling, menyerupai yang diterapkan baik internasional korelasi dan politik Amerika, yaitu penting dalam legalisasi akan pentingnya jaringan
karakteristik untuk hasil jaringan, tetapi alasannya berlaku regresi standar ke rekening untuk saling ketergantungan ini, tidak melaksanakan jauh dengan asumsi kemerdekaan.
Beberapa pendekatan yang menjanjikan juga telah dikembangkan dari metode statistik spasial
(Franzese dan Hays 2006; Ho_, Raftery dan Handcock 2002; Ho_ dan Ward 2004). Per- Barangkali pendekatan yang paling terlihat menurut statistik spasial yaitu ruang model jaringan laten
awalnya diusulkan oleh Ho_, Raftery dan Handcock _). Model ruang laten mengambil rekening dependensi jaringan dengan pemetaan setiap node untuk posisi di k berdimensi Uni Eropa-
ruang clidean. Posisi node dalam ruang laten ini kemudian dihubungkan kembali ke jaringan melalui asumsi bahwa lebih dekat dua node yang satu sama lain dalam ruang laten, semakin besar kemungkinan mereka untuk menyebarkan tepi. Sebuah regresi logistik kemudian e timasi dikawinkan mana, selain kovariat, jarak Euclidean antara setiap node dan setiap
simpul lainnya dikendalikan untuk. Sejak perkembangannya, pendekatan ruang laten semenjak itu diterapkan conict internasional (Ward, Siverson dan Cao 2007) dan agak luas untuk
perdagangan, proteksi kerja dan ekonomi politik internasional pada umumnya (Cao, Prakash dan Ward 2007; Ward dan Ho_ 2007; Ahlquist dan Ward 2009).
Ini bukan maksud kami di sini untuk pit ERGM terhadap pendekatan-pendekatan alternatif dan menemukan "metode untuk pemodelan saling ketergantungan yang kompleks, yang \ terbaik" \ terbaik pendekatan akan bervariasi oleh aplikasi menurut substansi dan pencarian metode universal yang terbaik adalah
pemurah. Sebaliknya, kita berusaha untuk memperkenalkan dan memperluas ERGM sebagai pendekatan yang mungkin
berkhasiat dalam banyak konteks. Kita mulai dengan menurunkan Model Exponential Acak Grafik dan membahas cara-cara di mana mengharuskan kita untuk berpikir di_erently perihal jaringan data, bagaimana memecahkan diad yang
duduk kasus ketergantungan, dan beberapa keterbatasan model. Kami kemudian mengusulkan solusi gres untuk duduk kasus yang sering dihadapi oleh para ilmuwan politik, tapi tidak dibahas secara sistematis dalam lainnya
literatur: apa yang harus dilakukan ketika jaringan bunga diamati dari waktu ke waktu. Kami memperlihatkan yang ERGM dan anjuran kami untuk menganalisis jaringan memanjang memakai dua pola yang dipiliuntuk kedua arti-penting dan eksposisi: jaringan cosponsorship di Kongres AS dan conict jaringan dalam sistem internasional. Kami merasa bahwa ini yaitu aplikasi ekspositoris baik
alasannya mereka membawa duduk kasus dengan coding hukum untuk korelasi jaringan yang sanggup mendasar mental mengubah makna analisis seseorang; jaringan cosponsorship cukup padat (Sangat saling berhubungan), membutuhkan pengenalan apa yang kita sebut jaringan \ menipis, "dan jaringan conict agak jarang, memperlihatkan kemungkinan \ penebalan "jaringan. Melalui contoh-contoh ini, kami juga akan memperlihatkan bahwa memakai ERGMs untuk model jaringan ini tidak hanya recti_es duduk kasus Bias sering dijumpai dengan aplikasi yang salah dari Classi metode cal, tetapi juga sanggup memperlihatkan wawasan yang lebih substantif dan menyarankan gres teoritis pendekatan.
2 Eksponensial Acak Grafik Model (ERGMs)
Sebuah model statistik yang berkhasiat untuk jaringan harus memenuhi dua kriteria utama. Pertama, harus menghindari asumsi bermasalah bahwa pengamatan relasional {pengamatan pada angka dua {adalah
bersyarat independen dari satu sama lain. Kedua, harus dalam beberapa cara memungkinkan untuk jaringan
struktur untuk dimodelkan. Idealnya, karakteristik yang terakhir ini akan sangat fleksibel, trans-
orangtua dan intuitif. Kami merasa bahwa kekuatan utama dari pendekatan ERGM untuk inferensial statistik dalam jaringan yaitu bahwa hal itu satis_es kedua kriteria tersebut.
Dalam rangka untuk membangun model tanpa asumsi kemerdekaan diad, kita perlu berpikir dalam mode agak di_erent perihal proses menghasilkan data.
Kita bisa membangun fungsi kemungkinan untuk setiap vektor bunga Y tanpa asumsi kemerdekaan dengan mempertimbangkan Y menjadi pengamatan tunggal dari distribusi probabilitas multivariat. Jadi, bukannya
memikirkan perihal Y sebagai serangkaian nilai yang diambil dari distribusi univariat (seperti halnya untuk model regresi standar), kami menganggapnya sebagai hasil imbang tunggal dari distribusi multivariat
di mana banyak lainnya menarik (banyak realisasi lain dari jaringan) yang mungkin. Dalam lain kata-kata, ada distribusi multivariat dari mana jaringan menyadari ditarik. Jika Y yaitu realisasi tunggal dari distribusi multivariat, kita tidak lagi harus menganggap kemerdekaan antara nilai-nilai Y dengan cara apapun. Kami akan tetap sanggup menarik kesimpulan perihal tertentu diad, sehingga unit analisis tidak perlu berubah, namun pengobatan multivariat Y yaitu lompatan konseptual yang diharapkan untuk menghindari duduk kasus yang terkait dengan pelanggaran kemerdekaan.
Tantangan pemodelan kemudian bergeser dari membangun model hasil univariat, parameter yang diperkirakan dengan memakai pengamatan, untuk membangun model distribusi multivariat yang satu jaringan ditarik dan yang parameter diperkirakan dengan pengamatan tunggal. ERGMs memperlihatkan pendekatan umum untuk membangun distribusi probabilitas ini. Untuk meresmikan intuisi yang diberikan di atas, kita mengikuti dan membangun derivasi dari kelas umum ERGMs disajikan oleh Park dan Newman _). Misalkan ada k statistik yang ; i = 1; : : : ; k yang sanggup dihitung pada jaringan (atau grafik) G , Yang analis percaya a_ect kemungkinan mengamati G Statistik ini sanggup meliputi langkah-langkah di- terconnectedness, timbal balik dalam jaringan diarahkan dan node atau angka dua tingkat nilai kovariat. The | parameter yaitu bagaimana kovariat dan elemen struktur jaringan dimodelkan pada waktu yang sama. Sementara tinjauan rinci parameter jaringan yang mungkin untuk menyertakan luar ruang lingkup diskusi ini, pembaca yang tertarik disebut Handcock et al. _) Dan Snijders et al. _) Untuk pengobatan menyerupai itu. Satu satunya kondisi yang kita butuhkan yaitu bahwa tidak ada bagian
dari | menjadi linear bergantung pada yang lain; dengan kata lain, tidak ada collinearity sempurna. Mengingat
N , Yang (_xed) jumlah node dalam G , Ada M mungkin set tepi atas N . Ini berarti bahwa jaringan diamati G yaitu salah satu M mungkin jaringan dengan jumlah yang sama node yang bisa diamati. Hal ini menggambarkan asumsi bahwa diamati jaringan G muncul stokastik dari pertolongan G M. Umum ERGM berasal memakai metode momen-matching. Kita mulai dengan menciptakan salah satu dari hanya dua asumsi yang diharapkan untuk ERGM: kita mengasumsikan bahwa setiap jaringan statistik dihitung pada grafik G yaitu nilai-nilai yang diharapkan dari statistik tersebut di lain mungkin grafik:
di mana | yaitu setiap statistik jaringan. Dengan kata lain, kita mengasumsikan bahwa nilai yang diharapkan dari saya
statistik jaringan yaitu nilai-nilai mereka sebagai dihitung dari G .
Sementara ini mungkin tampak menyerupai besar lengan berkuasa asumsi, satu harus diingat kenyataan bahwa, dalam banyak kasus, kita akan hanya mengamati satu realisasi jaringan (yaitu hanya ada satu menyadari kutipan jaringan Mahkamah Agung) dan nilai yang diamati dari statistik | bahwasanya indikasi terbaik dari yang diharapkan saya nilai
Namun distribusi lebih GM tidak sepenuhnya identi_ed pada dikala ini. Selain pembatasan dibuat dalam persamaan 1, kita juga harus mengasumsikan bahwa hanya statistik termasuk dalam | inuence yang probabilitas bahwa grafik m diamati, P (Gm). Hal ini dilakukan dengan memaksimalkan Gibbs entropi, S =- pada distribusi diskrit grafik di Gm subyek dengan kondisi dalam persamaan 2. ini identi_es diskrit fungsi massa probabilitas atas jaringan di Gm menjadi sedekat mungkin dengan distribusi seragam diskrit sementara memuaskan hambatan dalam persamaan 2. maksimalisasi ini dilakukan dengan memakai multiplier Lagrange
Metode. Sebagai akhir meningkatkan secara optimal ini, kita sanggup memulihkan formula elegan reecting relativitas yang tionship antara probabilitas grafik saya dan statistik jaringan di r
Dimana yaitu vektor k parameter yang menggambarkan ketergantungan P (Gi) pada jaringan statistik dalam | (lihat Lampiran untuk derivasi penuh). Kami kemudian sanggup menentukan antara maksimum kemungkinan atau metode Bayesian untuk memperkirakan'S. Kekuatan dari pendekatan ERGM terletak pada kenyataan bahwa kita telah diturunkan parametrik yang bentuk distribusi bunga dari kondisi yang sangat umum. Satu-satunya asumsi kami telah menciptakan yang A) yang kita amati nilai-nilai yang diharapkan dari | dan B) yang kita telah identi_ed yang faktor yang inuence probabilitas mengamati setiap grafik yang diberikan. ERGMs sehingga memperlihatkan Metode bisa memperkirakan e_ects kovariat standar serta e_ects jaringan lainnya properti tanpa harus menciptakan asumsi perihal kemerdekaan.
2.1 Menafsirkan ERGMs
Seperti halnya dengan model regresi standar, ada beberapa cara di mana orang sanggup menafsirkan parameter estimasi dari ERGM. Kami fokus pada dua tingkat interpretasi: jaringan-tingkat dan angka dua tingkat. Pada jaringan-tingkat, sering akan menarik untuk mengkarakterisasi distribusi diharapkan dari statistik jaringan. Misalnya, distribusi jumlah tepi di conict sebuah jaringan penting jika ada yang tertarik dengan frekuensi yang diharapkan perang antarnegara. Itu tantangan yaitu bahwa bentuk parametrik dari distribusi fungsi grafik tidak pribadi dipulihkan. Hal ini alasannya parameter dari ERGM menggambarkan korelasi antara sifat-sifat jaringan bunga G dan probabilitas mengamati G . Itu parameter sehingga tidak secara pribadi terkait dengan momen distribusi hasil
variabel (jaringan) alasannya mereka dalam model kemungkinan. Sejak ERGMs menghasilkan unik dan distribusi kompleks jaringan yang melibatkan setiap kemungkinan realisasi kombinasi tepi dengan jumlah yang sama dari node, ditutup bentuk manipulasi distribusi ini biasanya mungkin alasannya fakta bahwa M di penyebut persamaan 3 sering sejumlah besar. Dengan tidak adanya solusi bentuk tertutup, teknik simulasi memperlihatkan pribadi berarti dari mendekati distribusi statistik jaringan. Morris, Handcock dan Hunter (2008) mengembangkan algoritma untuk mensimulasikan jaringan dari distribusi tersirat oleh Parameter ERGM. Makara jika ada yang tertarik dalam distribusi beberapa statistik ( - ) de_ned pada jaringan, asumsi distribusi ini gampang didapat oleh simulasi sejumlah besar jaringan didasarkan pada parameter ERGM dan komputasi (-) untuk setiap jaringan (Morris, Handcock dan Hunter 2008; Handcock et al 2008.). Semakin besar jumlah simulasi, semakin akurat asumsi tersebut. Setelah distribusi diperoleh, asumsi karakteristik distribusi statistik jaringan sanggup diperoleh dengan ringkasan statistik (misalnya apa varians dalam jumlah perang?). Tingkat diad penafsiran akan menjadi yang paling bersahabat bagi ilmuwan politik menyerupai mirip dengan hasil dari regresi logistik. Pada angka dua tingkat, kuantitas kepentingan utama di sebagian besar jaringan yaitu kemungkinan keberadaan tepi tertentu (misalnya bagaimana mungkin itu bahwa ada perang antara AS dan Kanada?). Probabilitas tepi antara node saya dan j ditulis,
dimana n yaitu jumlah node, memperlihatkan semua diad selain Yij . K yaitu jumlah statistik jaringan di ERGM, dan yaitu jumlah dimana perubahan ketika Yij toggle dari 0 ke 1 (Goodreau, Kitts dan Morris 2009). Menggunakan persamaan 4 kita sanggup menghasilkan probabilitas diprediksi untuk tepi dalam jaringan. Perhatikan bahwa probabilitas diprediksi
tidak sanggup diproduksi tanpa termasuk ; ini yaitu keberangkatan besar dari perhitungan dari prediksi probabilitas dalam logit atau probit model yang. Dimasukkannya diharapkan alasannya di ERGMs, Pr () yaitu deterministik tergantung pada hasil angka dua bijaksana setiap lain angka dua. Di_erences nya samping, persamaan 4 menerima sedekat mungkin dengan jenis penafsiran yang biasa dengan model logit dan tidak mewakili keberangkatan utama dari semacam interpretasi _eld yang terbiasa. Ketika kovariat termasuk dalam model kemungkinan standar, varians dalam hasil atau variabel dependen kemunduran pada varians dalam variabel independen. Tapi di kasus ERGM, tidak ada varians dalam variabel dependen (jaringan, mengingat, yaitu pengamatan tunggal).
Dalam rangka untuk memperkirakan inuence kovariat, ERGMs mengeksploitasi Variasi hipotetis melalui jaringan yang terkandung dalam penyebut persamaan 3. Untuk setiap jaringan dihitung dalam persamaan 3, jumlah dari nilai-nilai kovariat untuk setiap tepi yang ditambahkan (Mencatat bahwa tepi yang ada mengatur perubahan untuk setiap jaringan). Parameter yang sesuai untuk kovariat speci_c kemudian memberitahu kami jika probabilitas mengamati grafik meningkat atau menurun sebagai jumlah dari nilai kovariat untuk semua diad terhubung meningkat. Sebuah positif nilai parameter memperlihatkan bahwa grafik di mana diad yang terhubung mempunyai kovariat tinggi nilai-nilai yang sangat mungkin untuk diamati relatif terhadap grafik mana diad terhubung mempunyai rendah nilai kovariat. Interpretasi dari parameter kovariat menyerupai dengan regresi kasus. Parameter dihargai positif berarti ada kemungkinan bahwa nilai-nilai kovariat tinggi sesuai untuk diad terhubung dan parameter negatif dihargai berarti ada kemungkinan bahwa kovariat rendah nilai sesuai dengan diad terhubung.
2.2 Keterbatasan ERGMs
Meskipun ERGM yaitu model yang besar lengan berkuasa dan fleksibel, itu su_ers dari sejumlah keterbatasan yang sanggup menghambat utilitas untuk peneliti. Keterbatasan utama dari ERGM adalah: duduk kasus degenerasi, ketidakmampuan untuk model jaringan dari waktu ke waktu, kepekaan terhadap data yang hilang, kemampuan terbatas untuk model jaringan dengan tepi non-biner, dan (terkait) fakta bahwa yang ideal coding hukum untuk tepi sering tidak jelas. Kami membahas sebagian dari keterbatasan ini di sini; di beberapa kasus, kami beropini bahwa kelemahan yang tidak membatasi mereka mungkin tampak. Kami memesan diskusi tepi biner / coding duduk kasus hukum dan duduk kasus analisis memanjang untuk pecahan 4.1 dan 4.2 masing-masing sebagai kami mengusulkan solusi speci_c untuk duduk kasus tersebut. Degenerasi yaitu duduk kasus estimasi terkait dengan model yang 't data buruk. Pada dasarnya, degenerasi hasil dari speci_cation dari model yang sangat tidak mungkin untuk mempunyai dihasilkan jaringan, bahwa ERGM tidak sanggup dihitung. Degenerasi terjadi ketika Model benjolan semua atau sebagian dari massa probabilitas hanya pada satu atau grafik beberapa kemungkinan. Di kebanyakan kasus degenerasi, massa probabilitas proporsional ditempatkan baik di lengkap (Terhubung penuh) atau kosong (tidak berafiliasi sama sekali) jaringan (Handcock 2003).
Setelah ERGM telah speci_ed, diperkirakan memakai rantai Markov Monte Carlo, tapi merosot atau model merosot dekat mengakibatkan duduk kasus dalam proses estimasi (lihat Snijders _) untuk
klarifikasi rinci). Jika model tidak baik speci_ed, probabilitas diperkirakan akan berjalan rantai untuk grafik ekstrim semua atau tidak ada tepi, di mana ia akan tinggal, dan model ini dikatakan merosot. Sementara degenerasi bisa menciptakan frustasi, itu tidak selalu menjadi gangguan besar di diterapkan penelitian. Karena model yang sangat tidak mungkin telah menghasilkan jaringan akan
merosot, degenerasi adalah, dalam arti, pernyataan perihal model 't. Hal ini tentu harus tidak diartikan bahwa model yang diberikan _ts baik hanya alasannya tidak merosot, tetapi model yang merosot niscaya tidak 't baik. Sejak termasuk parameter atau variabel yang berkontribusi tidak ada informasi yang berarti untuk prediksi jaringan hasil akan biasanya mengakibatkan degenerasi, kita harus berpikir hati-hati perihal komponen model untuk diperkirakan dan adakala pencarian speci_cation mungkin diperlukan. Standar cukup tidak menyerupai model regresi, ERGMs dengan satu set \ standar kontrol "yang melaksanakan apa-apa untuk memprediksi
hasilnya akan mengakibatkan duduk kasus degenerasi dan dengan demikian dilarang speci_ed. Mayor
\ Kelemahan "dari ERGMs kemudian yaitu kenyataan bahwa model seseorang harus benar-benar 't data cukup baik; tidak banyak keterbatasan dalam pendapat kami. Itu masuk akal untuk mempertimbangkan frustrasi sesekali peneliti mungkin mengalami dengan Model degenerasi terhadap kenyamanan kerangka regresi tradisional. Fundamentalisme yang tal duduk kasus di sini yaitu apakah orang harus lebih pelanggaran asumsi kemerdekaan dengan sebuah MLE dihitung untuk model yang menghasilkan kesalahan ketika erlalu misspeci_ed. Kita merasa degenerasi yang benar-benar membantu analis ERGM dalam hal ini dalam hal ini akan mengembalikan error degenerasi sebelum kembali hasil untuk model tidak informatif. Dengan kata lain, logistik regresi data jaringan membuatnya cepat dan gampang untuk _nd tanggapan {termasuk salah Jawabannya {sedangkan peneliti memakai ERGMs sesekali mungkin _nd bahwa mereka harus mengubah yang speci_cation model mereka dalam rangka untuk menentukan model yang _ts data cukup baik menjadi diduga. Kelemahan potensial lain dari pendekatan ERGM ke jaringan pemodelan yaitu sebagai-dalam sangkaan bahwa statistik jaringan yang sesuai untuk memasukkan dalam model diketahui. Sementara asumsi ini tidak di_erent di alam daripada asumsi \ speci_cation benar " dibuat dalam model gaya regresi, beberapa mungkin mengklaim bahwa di_culty dari surmounting ini rintangan yang magni_ed oleh fakta bahwa para ilmuwan politik jarang mempunyai keinginan teoritis perihal jaringan struktur menyerupai segitiga ditutup, timbal balik, transitivitas, atau lainnya segudang statistik jaringan yang sanggup dimasukkan dalam speci_cation ERGM. Kami melihat kritik ini sebagai decreasingly valid. Hal ini tentu hal yang ilmu politik beberapa teori eksplisit berbicara dengan statistik jaringan, tetapi sejarah tidak berteori perihal jaringan Struktur bukan alasan untuk membuang struktur jaringan selain tidak secara teoritis berguna. Memang, sejumlah teori {seperti keseimbangan kekuasaan dan segala macam permainan strategis {im- ply kiprah struktur jaringan. Teori Selain itu, beberapa studi terbaru telah merumuskan yang menghasilkan keinginan speci_c untuk struktur jaringan tertentu. Sebagai contoh, Cranmer,
Desmarais dan Kirkland _) mengembangkan teori laba sinergis dalam utilitas dari triadic penutupan dalam jaringan aliansi dan kemudian _nd penutupan triadic menjadi sopir empiris penting pembentukan aliansi. Singkatnya, kami menyadari bahwa teori jaringan korelasi internasional dikala ini tidak di mana-mana, tetapi mengandaikan bahwa teori tersebut tentu mungkin dan memang _eld mungkin bergerak ke arah itu. Data yang hilang juga sanggup sangat bermasalah dalam konteks jaringan. Speci_cally, di- perbedaan perihal pentingnya parameter kovariat atau struktural sanggup diubah oleh hilang nilai-nilai tepi; dalam kasus-kasus tertentu, sejumlah kecil data yang hilang sanggup mempunyai diucapkan e_ects. Di beberapa cara, ini tidak di_erent dari duduk kasus data hilang dihadapi dalam tradisional
Kerangka regresi: sejumlah kecil missingness (terutama hilang pengamatan untuk kejadian langka) sanggup telah diucapkan e_ects pada inferensi (Rubin 1976;. King et al, 2001). Dimana tantangan data yang hilang yaitu magni_ed untuk ERGMs yaitu bahwa beberapa imputasi e_ective yaitu lebih di_cult untuk mencapai daripada bagi model yang mempertahankan persegi panjang tradisional struktur data. Salah satu pilihan untuk memecahkan duduk kasus ini yaitu dengan memakai beberapa imputasi di tepi-daftar (dyadic) representasi dari jaringan. Satu bahkan sanggup menghitung deskriptif statistik jaringan pada tingkat simpul {seperti sentralitas, betweenness dan sebagainya {dan termasuk mereka dalam model imputasi. Ini yaitu solusi tepat namun alasannya dependensi dari struktur jaringan tertentu tidak bisa diperhitungkan. Ini yaitu duduk kasus terbuka yang bekerja gres pada inferensi dengan jaringan sampel berupaya untuk mengatasi (Handcock dan Gile akan datang), tetapi tetap bermasalah dari perspektif diterapkan.
3 Estimasi ERGM
Parameter dalam bentuk persamaan 3, ERGM mempunyai keluarga eksponensial bentuk logging fungsi kemungkinan, dan sebagai hasilnya, permukaan log-kemungkinan secara global cekung di pasien yang parameter-(van Duijn, Gile dan Handcock 2009). Ini yaitu setup ideal untuk Newton-Raphson
Jenis maksimalisasi fungsi kemungkinan untuk _nd parameter, tetapi tantangan muncul dalam kenyataan bahwa perhitungan yang tepat dari fungsi kemungkinan yaitu de- terlalu komputasi Manding untuk sebagian besar jaringan dan statistik jaringan () dari kepentingan praktis. Seperti yang bisa dilihat di penyebut persamaan 3, perhitungan fungsi kemungkinan membutuhkan penjumlahan atas semua kemungkinan con_gurations jaringan. Untuk jaringan diarahkan dengan n node, ini merupakan 2 () jaringan. Sebuah jaringan dengan hanya 9 node sanggup mengasumsikan 68719476736 con_gurations, sejumlah yang meningkatkan oleh perkalian faktor 1073741824 jika num yang ber node meningkatkan ke 12. Tak perlu dikatakan, dalam rangka untuk memperkirakan ERGM pada jaringan 100-200 node, fungsi kemungkinan harus didekati. Dua metode kira mation telah menemukan aplikasi biasa dalam literatur {pseudolikelihood maksimum (Frank dan Strauss 1986) dan Markov Chain Monte Carlo (MCMC) kemungkinan maksimum (Geyer dan Thompson 1992). Pendekatan MCMC dikala ini default untuk sebagian besar perangkat lunak paket dan merupakan bentuk maksimal simulasi kemungkinan. Metode ini berulang dan Algoritma bekerja sebagai berikut: dalam meningkatkan secara optimal iterasi yang diberikan, jumlah dalam penyebut fungsi kemungkinan didekati memakai serangkaian jaringan sampel dari distribusi yang tion parameter dengan parameter yang dimaksimalkan kemungkinan memakai sebelumnya sampel jaringan. Optimasi berulang ini berlangsung hingga ada sedikit perubahan dalam asumsi nilai fungsi likelihood. Kovarians matriks parameter kemudian dihitung sebagai kebalikan dari Hessian negatif dari fungsi log-likelihood. Pseudocode untuk algoritma MCMC-MLE di Geyer dan Thompson Š), yang merupakan algoritma yang dipakai dalam paket perangkat lunak yang paling untuk estimasi ERGM, diberikan dalam _gure 1.
Teknik pseudolikelihood yaitu metode pendekatan analitik. Sendi likeli- kap ikatan dalam jaringan diganti dengan produk di atas probabilitas bersyarat masing-masing dasi diberikan ikatan lain dalam jaringan. Artinya, untuk keunggulan diberikan ij , Tepi-bijaksana probabilitas dasi (pij) diberikan dalam persamaan 4. The pseudolikelihood maksimum yaitu com- puted dengan memakai algoritma bukit-mendaki ke _nd vektor parameter yang memaksimalkan log (). Hal ini sangat nyaman di bahwa hal itu sanggup dihitung dengan memakai logis- standar software regresi tic, dengan kovariat diad dan statistik perubahan jaringan menyusun matriks desain. Seperti dengan metode MCMC, sebuah matriks kovarians asumsi untuk yang pseudolikelihood maksimum dibuat dengan membalik matriks informasi diamati (yaitu varians sampel asimtotik dari estimator regresi logistik dipakai untuk menghitung pseudolikelihood). Sebagai dua metode pendekatan, ada pro dan kontra terkait dengan setiap ap- proach. Keuntungan dari pendekatan MCMC yaitu bahwa dalam batas (dengan jumlah in_nite dari menarik dari distribusi jaringan), menghasilkan asumsi setara dengan MLE. Itu kerugian dari teknik ini yaitu bahwa jumlah menarik harus _nite, perhitungan sanggup mengambarkan cukup di_cult untuk jaringan besar dan {karena simulasi dipakai {dua analis sanggup menghasilkan hasil di_erent ketika melaksanakan penelitian yang sama. Untuk pseudolikelihood yang Pendekatan, perhitungan biasanya cepat dan konvergensi tertentu, tetapi ada beberapa beton Hasil yang mencirikan tingkat bias atau kehilangan e_ciency diinduksi dengan mengganti sendi kemungkinan dengan produk lebih conditional. Estimasi MCMC telah disukai di baru-baru ini analisis, meskipun tidak tanpa pengecualian (lihat contohnya Faust dan Skvoretz € 2), Saul dan Filkov(2007) dan Danny, Choudhury dan Bilmes)). van Duijn, Gile dan Handcock) melaksanakan percobaan Monte Carlo untuk membandingkan pseudolikelihood dan MCMC metode; mereka _ndings mendukung dominasi terbaru dari MCMC-MLE. Untuk statistik jaringan, mereka _nd bahwa pseudolikelihood maksimum yaitu 60 {80% sebagai e_cient sebagai MCMC-MLE, dan untuk kovariat eksogen e_ects itu 80-95% sebagai e_cient sebagai MLE2. Lebih mengkhawatirkan bagi kiprah pengujian hipotesis yaitu _nding bahwa interval con_dence berasal dari terbalik 2 E_ciency diukur sebagai kebalikan dari mean kuadrat kesalahan estimasi parameter dalam Monte Carlo percobaan.
informasi _sher diamati bias memakai pseudolikelihood, tapi tidak dengan MCMC. Speci_cally, mereka _nd bahwa probabilitas cakupan untuk nominal 95% interval con_dence hanya 74,6% untuk statistik yang menangkap pengelompokan dalam jaringan. Dalam aplikasi _rst bawah ini, kami memakai MCMC, yang diimplementasikan dalam R paket ergm (Handcock et al. 2010), dan dalam aplikasi kedua kami mengadaptasi pendekatan pseudolikelihood untuk estimasi vektor tunggal parameter ERGM yang meliputi beberapa realisasi dari jaringan yang sama.
4 Aplikasi
Kami kini mempertimbangkan dua aplikasi dari ERGMs data ilmu politik. Kami telah menentukan aplikasi ini alasannya mereka memungkinkan kita tidak hanya untuk lebih menggambarkan metode yang kita miliki dijelaskan di atas, tetapi juga alasannya masing-masing kekuatan kita untuk bergulat dengan di_erent (dan umum) Masalah diterapkan kami belum ditangani speci_cally atas: apa yang harus dilakukan ketika jaringan baik padat dan dihargai (yaitu tepi sanggup mengasumsikan nilai lebih dari 0 dan 1) dan bagaimana bekerja dengan beberapa realisasi dari jaringan tertentu. Terakhir, kami berharap bahwa di_erent yang sub_elds dari mana aplikasi yang diambil akan memperlihatkan penerapan luas ERGMs dalam ilmu politik.
Untuk masing-masing aplikasi, kami berjalan melalui proses speci_cation dan-pertimbangan yang perundingan yang masuk ke dalamnya dari awal hingga final lebih sebagai peneliti akan di o_ce mereka daripada pembaca terbiasa melihat di media cetak. Hal ini dilakukan secara ketat untuk eksposisi.
4.1 Menganalisis Jaringan Cross-Sectional:
Cosponsorship di Kongres AS Aplikasi _rst kami diambil dari politik Amerika dan meluas ilham yang dikembangkan oleh Fowler 2008). Di Kongres AS, legislator umumnya mensponsori undang-undang yang disponsori oleh lainnya legislator.3 Jaringan cosponsorship diwujudkan bila kita menganggap cospon- legislator ini sorship undang-undang lain legislator untuk menjadi keunggulan antara dua legislator. Ini berharga mencatat bahwa ada beberapa perbedaan pendapat perihal makna yang tepat dari dasi cosponsorship: beberapa beropini bahwa itu merupakan sinyal dari cosponsor pertolongan untuk subjek soal undang-undang (Kessler dan Krehbiel 1996). Lain beropini bahwa itu merupakan memperlihatkan pertolongan dari satu legislator yang lain (Fowler 2006). Sementara itu berada di luar ruang lingkup aplikasi ini untuk memilah-milah arti yang tepat dari dasi cosponsorship, kami percaya bahwa kami sanggup menghapus duduk kasus de_nitional dengan melihat dasi cosponsorship sebagai bentuk kedekatan antara dua legislator; apakah mereka oke dengan hal kebijakan atau politik, dasi cosponsorship merupakan indikasi keterlibatan aktif antara legislator.
Kami menilik jaringan cosponsorship memakai data dari (Fowler 2006).4
Dataset ini mencatat cosponsorship dan sponsor dari setiap tagihan di dewan perwakilan rakyat AS dan Senat untuk 93 melalui kongres ke-109. Tepi dari legislator I untuk legislator j dalam jaringan yaitu jumlah kali legislator I mempunyai cosponsored legislator j . Perhatikan bahwa jaringan
diarahkan dan bahwa nilai tepi yaitu bilangan bundar non-negatif. Ketika melaksanakan analisis, kita cepat disajikan dengan duduk kasus teknis. Dalam sesi Kongres, interval waktu yang kita gunakan untuk de_ne sebuah instance dari jaringan cosponsorship, yaitu mungkin bahwa setiap cosponsors perwakilan lain banyak kali. Hal ini bermasalah alasannya dua alasan. Pertama, ERGM hanya dikembangkan untuk han- korelasi biner dle, jadi kita tidak bisa memakai teknologi ERGM untuk model jumlah kali setiap cosponsors perwakilan lain dalam sesi. Banyak alat untuk analisis jaringan hanya tepat untuk korelasi biner, dan kita tidak _rst untuk menghadapi duduk kasus ini {dengan Con- jaringan Cosponsorship gressional speci_cally. Kedua Fowler (2006) dan Faust dan Skvoretz
3 Aturan kongres mendikte bahwa mungkin ada hanya satu sponsor untuk tagihan, tidak ada sponsor bersama.
4 Fowler cosponsorship data saya s bebas tersedia dari ia situs web di(2002) mengatasi duduk kasus ini dengan thresholding, dan mengobati setiap hitungan cosponsorship positif lebih besar dari nol sebagai cosponsorship a. Masalah kedua berkaitan dengan struktur cosponsorship jaringan speci_cally. Seperti sanggup dilihat dari sel kiri atas dari Gambar 2, memperlakukan setiap tindakan cosponsorship sebagai pola korelasi cosponsorship menghasilkan jaringan sangat padat. Jika kita mencoba untuk memperkirakan ERGM pada jaringan ini, para-parameter ters akan menghasilkan jaringan di mana setiap dasi mungkin ada dan model akan merosot menyerupai dibahas di atas.
Dalam rangka untuk mengubah korelasi berbasis hitungan ke tepi biner serta menghasilkan jaringan yang memungkinkan non degenerate estimasi ERGM, kami menentukan untuk menciptakan jaringan biner yang kurang padat dari itu dalam perawatan sebelumnya dengan mengharuskan jumlah yang lebih besar dari cosponsorships dari satu untuk memperlihatkan korelasi cosponsorship. Rata-rata jumlah cosponsorship korelasi antara legislator di 108 rumah 13,76. Untuk \ tipis "jaringan, kita harus menentukan ambang (jumlah ikatan cosponsorship antara dua legislator) di atas yang kita akan arahan tepi dan bawah yang kita tidak akan. Jelas, ketika menipis jaringan, hati-hati perhatian harus dibayarkan kepada makna substantif menipis serta sensitivitas model kesudahannya diproduksi dengan hukum menipis. Pemilihan threshold menyerupai yaitu tentu agak diktatorial dan sehingga sangat penting untuk mencoba beberapa nilai ambang batas sebagai analisis sensitivitas. Saat menguji sensitivitas model, salah satu harus mencari baik perubahan signi_cant dalam asumsi serta duduk kasus dengan model yang degenerasi. Selanjutnya, kita harus memperlihatkan bahwa sensitivitas dari model ke ambang menipis dipilihnya dasarnya di_erent yaitu tidak selalu hal yang jelek ketat. Jika hasilnya terasa di_erent antara, katakanlah, nilai ambang batas rendah dan tinggi, yang memberitahu kita sesuatu yang sangat menarik perihal data. Bahkan bisa menyarankan tepi ambang rendah merupakan jenis mendasar di_erent tepi dari tepi ambang batas tinggi (dalam hal ini, bahwa cosponsorship kasual dasarnya di_erent dari sangat sering cosponsorship) dan bahwa proses mendasar di_erent sedang bekerja. Langkah _rst kami dalam model _tting yaitu untuk menyesuaikan coding (penipisan) hukum kami ke substantif aplikasi. Ambang batas yang konstan mungkin tidak alasannya fakta bahwa ada varians dalam jumlah tagihan setiap sponsor legislator. Oleh alasannya menyensor di ambang yaitu di pecahan sensus pada legislator I 'S kecenderungan untuk mensponsori legislator j dan pembuat undang-undang j 'S frekuensi sponsorship. Karena kita hanya tertarik pada mantan, kita menerapkan gres coding pemerintahan oleh mempertimbangkan legislator saya a cosponsor dari legislator j jika legislator saya telah cosponsored persen pembuat undang-undang j 'S disponsori undang-undang. Fokus kami dibatasi sini ke 108 rumah untuk singkatnya.
Setelah bereksperimen dengan beberapa nilai ambang batas menipis kami menemukan bahwa ambang menjadi- tween 1% dan 10% menghasilkan jaringan cukup padat menangkap antara 20% dan 50% dari semua korelasi mungkin. Tingkat kepadatan media ini menghasilkan asumsi Model invarian dan menghindari degenerasi. Kovariat yang kita termasuk dalam model yaitu indikator apakah undang lators menyebarkan pihak yang sama, di_erence mutlak dalam dimensi _rst dari DW-Nominasikan, hitungan layanan komite tumpang tindih, dan indikator bersama-negara. Kami juga meliputi jaringan parameter untuk timbal balik (count dasi asimetris), cyclicality (hitungan tiga kali lipat siklik), dan transitivitas (hitungan transitif tiga kali lipat). Ingat bahwa dasi asimetris yaitu salah satu bentuk f saya ! j g dan triple siklik mengambil bentuk f saya ! j; j ! k; k ! saya g, Sedangkan transitif tiga yaitu dalam bentuk f saya ! k; I ! j; j ! k g . Kami memakai R paket ERGM (Handcock et al. 2010) untuk 't model.5
Hasil ERGM dengan dan tanpa statistik jaringan disajikan pada Tabel 1. Sebuah melihat _rst di Model 't menyampaikan bahwa sifat sistemik dari jaringan Cosponsorship yaitu sangat p enting; masuknya parameter jaringan tiga mengurangi BIC dengan lebih 5 R arahan lengkap untuk aplikasi ini berada di Lampiran.
dari 25%. Tanda-tanda semua kovariat dalam arah yang diharapkan. Perwakilan dari negara yang sama lebih mungkin menjadi cosponsors dan merupakan anggota dari sama partai, mereka yang menyebarkan keanggotaan komite dan orang-orang yang ideologis serupa. Satu _nding mencolok yaitu bahwa ketika karakteristik jaringan dicatat, bersama Partai tidak lagi statistik signi_cant setiap batas tradisional. P-value untuk menyebarkan Partai yaitu sekitar 0,002 dalam model terbatas yang tidak memperhitungkan jaringan struktur, tetapi naik ke 0,65 ketika parameter jaringan disertakan. Ini yaitu terang dan pola konsekuensial dari berat yang rusak yang sanggup dikaitkan dengan e_ects kovariat dikala struktur jaringan tidak benar diperhitungkan. Seperti sanggup dilihat pada Tabel 1, arti_cially e_ects kovariat inated sanggup dengan gampang menghasilkan kesimpulan yang salah. Jaringan Rumah pameran tingkat tinggi timbal balik, tingkat rendah Siklus dan tingkat tinggi transitivitas; kegagalan untuk memperhitungkan ini e_ects diucapkan menyerupai dengan model misspeci_cation dan dibatasi Model pada Tabel 1 reects bias dihasilkan. Kami juga sanggup memakai ERGMs kami telah speci_ed untuk menghasilkan pemahaman yang lebih baik deskriptif ings dari korelasi antara legislator. Tabel 2 menyajikan tampilan alternatif bagaimana mempertimbangkan faktor jaringan sanggup mengubah (dan meningkatkan) kesimpulan perihal out- diad tiba dalam jaringan cosponsorship. Setiap entri O_-diagonal yaitu satu set tiga elemen yang termasuk A) indikator biner korelasi cosponsorship, B) probabilitas bersyarat dari cosponsorship dari model penuh, C) probabilitas bersyarat dari cosponsorship dari kovariat-satunya model. Baris sesuai dengan cosponsor dan kolom sponsor. Kita melihat bahwa model penuh dan kovariat-hanya memproduksi probabilitas terasa di_erent, dan bahwa rata-rata, model penuh memperlihatkan prediksi yang lebih akurat.
4.2 Jaringan Over Time:
Conict dalam Sistem Internasional
Aplikasi kedua diambil dari korelasi internasional; kita berusaha untuk menjiplak dan ulang menganalisis model perselisihan antar militer (MID) awalnya dikembangkan oleh Maoz et al. _) Menggunakan teknologi ERGM. Alasan kami menentukan aplikasi ini yaitu dua lipat: Data angka dua tahun sangat umum di conict beasiswa dan, alasannya tidak biasa bagi negara-negara untuk terlibat dalam beberapa sengketa pada tahun tertentu, kemerdekaan yaitu asumsi bermasalah. Beberapa penelitian dalam korelasi internasional telah speci_ed inferensial model conict sebagai fenomena jaringan; Maoz et al. _06) Artikel menarik alasannya penulis secara eksplisit menyatakan bahwa conict internasional harus diperlakukan sebagai jaringan (lainnya pola perintis termasuk Maoz _06) dan Ho_ dan Ward _)). Kami akan pergi ke yang lebih besar rinci mengenai speci_cation dari model kita menjiplak lama, tapi _rst kami menyajikan kami penemuan dalam estimasi ERGMs untuk jaringan longitudinal diamati yang kita gunakan untuk menganalisis jaringan conict.
4.2.1The Pooled Exponential Acak Grafik Model
Dalam aplikasi kedua ini kita membangun model yang sedekat mungkin ke salah satu asumsi di Maoz et al. _) Untuk mengamati laba substantif dan teknis bekerja dalam kerangka ERGM.
Aplikasi orisinil menganggap semua diad di negara pecahan Sistem dari 1870 {tahun 1996, total 450.306 pengamatan diad. Variabel dependen yaitu indikator untuk terjadinya setidaknya satu militer antarnegara sengketa (MID) antara dikembangkan untuk menangani jaringan tunggal dan tidak sanggup dipakai untuk menghitung satu set asumsi yang meliputi beberapa jaringan dikumpulkan. Kami mengembangkan dan menerapkan ERGM dikumpulkan untuk aplikasi ini. Salah satu kualitas membantu satu dikumpulkan ERGM untuk tujuan perbandingan dengan logit diad, yaitu bahwa parameter ERGM mengurangi kepada mereka regresi logistik jika coe_cients pada statistik jaringan yaitu nol (yaitu struktur jaringan baik tidak disertakan atau mempunyai persis ada e_ect). Pilihan kita akan biasanya harus menciptakan antara pseudolikelihood maksimum dan MCMC untuk memperkirakan dikumpulkan ERGM yaitu nulli_ed dalam hal ini: beban komputasi terkait dengan memperkirakan dikumpulkan ERGM oleh MCMC-MLE yaitu sanggup diatasi diberikan skr menyewa teknologi dan fakta bahwa kita harus memperkirakan model di 126 jaringan. Ini duduk kasus komputasi tidak akan selalu a_ect setiap analisis ERGM dikumpulkan, tetapi tidak unik untuk aplikasi kita sehingga layak dipertimbangkan. Masalahnya menyajikan di Newton- Raphson langkah meningkatkan secara optimal dalam estimasi berulang parameter ERGM. Mengingat set terakhir dari parameter yang ditemukan dengan memaksimalkan kemungkinan asumsi dengan sebelumnya sampel jaringan, dikala ini meningkatkan secara optimal bukit-climbing mengharuskan seluruh sampel jaringan akan diselenggarakan di memori. Karena ukuran jaringan MID bervariasi tahun, unik sampel jaringan harus disimpan untuk setiap tahun. Setiap seri dari seri 127 jaringan yaitu panjang 10.000 {menggunakan 10.000 jaringan untuk pendekatan kemungkinan. Memperkirakan menyerupai Model dengan cepat menguasai kemampuan (saat ini) server yang sangat kuat. 6 Selain MCMC, kita memakai pseudolikelihood maksimum dan menerapkan metode bootstrap resampling (Efron 1981) untuk menghitung interval con_dence. Seperti yang terjadi, tantangan komputasi dari serangkaian besar jaringan yaitu sesuatu dari berkat menyamar. Mengingat bahwa, dalam banyak speci_cations ERGM, semua diad tergantung satu sama lain, yaitu tidak mungkin untuk partisi sampel diad menjadi unit-unit independen. Jika partisi menyerupai itu mungkin, mekanisme resampling nonparametrik menyerupai bootstrap yang 6 Sebuah perjuangan untuk menerapkan algoritma ini kelebihan beban 96 gigabyte ram pada server.