محققان در نهایت دسترسی به داده ها در Facebook نقش در گفتمان سیاسی

محققان می خواهید به دانستن بیشتر در مورد چگونه اطلاعات غلط گسترش رسانه های اجتماعی می تواند بر نتایج انتخابات.

رویترز/جاناتان ارنست

آن را در زمان 20 ماه دیگر از برنامه ریزی شده و دلهره آور آماری چالش باقی مانده است. اما Facebook است که در نهایت به محققان دسترسی به گنجینه ای از اطلاعات در مورد چگونه کاربران خود را به اشتراک گذاشته اند اطلاعات و اطلاعات غلط در رویدادهای اخیر سیاسی در سراسر جهان است.

داده هایی که در دسترس ساخته شده امروز شامل 38 میلیون آدرس ها مربوط به گفتمان مدنی که به اشتراک گذاشته شد علنا در Facebook بین ماه های ژانویه جولای 2017 و 2019. آنها فاش کردن جزئیات مانند این که آیا کاربران به عنوان یک سایت مرتبط به خبر جعلی و یا سخنرانی نفرت و اینکه آیا یک لینک کلیک شده یا دوست داشت. Facebook نیز ارائه اطلاعات دموگرافيک سن ، جنسیت و محل سکونت—در مورد افرادی که به اشتراک گذاشته شده کلیک و یا دوست game, این لینک و همچنین سیاسی خود را سنایی غزنوی.

در مارس 2018, Facebook اعلام کرد که دانشمندان علوم اجتماعی را به زودی دسترسی به این مشترک-لینک داده. اما پس از آن داده های خود را از کارشناسان متوجه شدم که ساخت داده های موجود می تواند سازش حریم خصوصی از بخش قابل توجهی از آن 2 میلیارد کاربران است.

برای حل مشکل این شرکت تصمیم به اعمال می شود به تازگی توسعه یافته ریاضیات-بر اساس روش برای اطمینان از گمنامی کاربران آن به نام حریم خصوصی دیفرانسیل (DP) قبل از انتشار “پیوندهای مشترک” مجموعه داده. که کار در حال حاضر انجام شده است و دانشمندان علوم اجتماعی در حال مدیری نتایج.

“این یک گام بزرگ رو به جلو” می گوید: Joshua تاکر یک استاد سیاست و مطالعات روسیه در دانشگاه نیویورک است که به امید استفاده از داده ها برای تقویت مطالعات خود را در مورد چگونه به لحاظ سیاسی به اتهام اخبار گسترش در سراسر سیستم عامل رسانه های اجتماعی. “این است که بسیار نزدیک به آنچه که وعده داده شده بود در [مارس 2018] اطلاعیه. این اجازه خواهد داد که ما برای انجام بسیاری از تحقیقات ما تا به حال پیشنهاد شده و برخی از چیزهایی که حتی در [که پیشنهاد].”

اما این راه حل نیز ارائه دانشمندان علوم اجتماعی با چالش مقابله با تحریف و یا سر و صدا شده اند که تزریق به داده ها از طریق استفاده از دیفرانسیل حفظ حریم خصوصی. اطلاعات مدیران همواره در تلاش برای اطمینان از حفظ حریم خصوصی اما DP نیاز به روش های جدید. در آن نیاز به تزریق بیشتر سر و صدا هنگامی که فردی سلول های کوچکتر.

اما آن دسته از سلول های کوچکتر نیز ممکن است حاوی برخی از نتایج مهم است. “بنابراین ما نیاز به آمده تا با روش هایی که ما را متقاعد کند که اطلاعات مفید در پاسخ به این سوال ما مطرح کرده اند” تاکر می گوید.

عجله کنید و صبر کنید

گزیدگی توسط شواهدی وجود دارد که آن را داده بود و فعالان سیاسی استفاده غیر مجاز از داده های Facebook مقامات اعلام کرد در مارس سال 2018 است که آن را عطا محققان دسترسی کامل به اطلاعات در مورد کاربران خود را با هیچ رشته های متصل. که اطلاعات تا به حال در نظر گرفته شده است اختصاصی و هر در دسترس عموم تحقیقات انجام شده بر روی آن بود و یا انجام در خانه و یا مورد نیاز preapproval از Facebook.

گری کینگ کمی از دانشمندان علوم اجتماعی در دانشگاه هاروارد و ناتانیل Persily یک استاد حقوق در دانشگاه استنفورد به سرعت با تشکیل یک نهاد غیر انتفاعی, اجتماعی, علوم, یکی, که میزبان داده ها در وب سایت خود و دامپزشک درخواست به آن دسترسی داشته باشید. چند عمده سازمان های خیریه سون در 11 میلیون دلار به صندوق پیشنهادات از دانشمندان که می خواستم به استفاده از اطلاعات و علوم اجتماعی شورای پژوهشی (SSRC) یک سازمان غیر انتفاعی است, توافق به مدیریت حیطه دادن کمکهای مالی روند.

SSRC قرار دادن یک تماس به صورت طرح و تاکر دریافت یکی از ده ها کمک هزینه تعلق می گیرد که در دور اول برای $50,000. تاکر که همچنین یک مشاور علوم اجتماعی, یک, به تازگی دریافتند که Facebook کاربران مسن تر از 65 شدند نزدیک به هفت بار به عنوان به احتمال زیاد برای به اشتراک گذاشتن اطلاعات غلط در runup به سال 2016 انتخابات در ایالات متحده به عنوان کسانی که در 20s خود را.

این پروژه متکی سنتی نظرسنجی از مردم که تا به حال توافق برای به اشتراک گذاری آنلاین خود را از رفتار. تاکر می خواستم برای رفتن بیشتر ارتباط در دسترس عموم داده او تا به حال به دست آمده از ق و توییتر به غیر عمومی کاربر داده های برگزار شده توسط Facebook. اما اطلاعات در دسترس نیست.

“هنگامی که Facebook اصل توافق را به داده های در دسترس به دانشگاهیان از طریق یک ساختار ما توسعه و … [مدیر عامل] مارک زوکربرگ شهادت در مورد ایده ما قبل از کنگره ما به فکر این روز می تواند در حدود دو ماه از کار. آن را گرفته و بیست” شاه و Persily نوشتن در یک وبلاگ پست امروز.

دو دانشمندان معتقدند وجود دلایل خوبی برای به تاخیر بیاندازد. “بیشتر از گذشته 20 سال است درگیر مذاکره با Facebook خود را به طور فزاینده ای محافظه کار views حریم خصوصی و قانون” که نوشتن “[A]nd, تماشای Facebook ساخت یک امنیت اطلاعات و حفظ حریم خصوصی داده ها زیرساخت های کافی برای به اشتراک گذاشتن داده ها با دانشگاهیان.”

Facebook صرف 11 میلیون دلار و اختصاص بیش از 20 تمام وقت کارکنان به این پروژه می نویسد Chaya نایاک که آگهی های شرکت در انتخابات کمیسیون تحقیقات که در حال کار با علوم اجتماعی یکی. نایاک همچنین یک بیت از crowing: “این نسخه ارائه می شود در تعهد ما ساخته شده در جولای 2018 برای به اشتراک گذاشتن یک مجموعه داده را قادر می سازد که محققان به مطالعه اطلاعات و اطلاعات غلط در Facebook در حالی که همچنین اطمینان حاصل کرد که ما به محافظت از حریم خصوصی کاربران است.

نتایج قابل اعتماد

گام بعدی این است که به محققان. چالش این است که به شکل از چگونه برای انطباق با روش های سنتی تجزیه و تحلیل مجموعه داده های بزرگ مانند حمل و رگرسيون چند متغيره در آن محافظت دیفرانسیل با حفظ حریم خصوصی.

“سانسور [برخی از ارزش] و سر و صدا همان است که انتخاب تعصب و اندازه گیری خطا تعصب—هر دو جدی مسائل آماری” پادشاه و Persily نوشتن. “آن را می سازد هیچ حس … به ارائه اطلاعات به محققان تنها به پژوهشگران (و جامعه) گمراه و نقشه کشی اشتباه نتیجه گیری در مورد اثرات رسانه های اجتماعی در انتخابات و دموکراسی است.”

این ماه پادشاه و دانشجوی کارشناسی ارشد جورجینا Evans توضیح داد که چگونه به انجام رگرسیون خطی در differentially خصوصی مجموعه داده. به طور مشابه, Facebook دانشمندان فقط ارسال شده در preprint با دستورالعمل در ایجاد چنین مجموعه داده ها

تاکر می گوید دانشمندان باید متقاعد شود که تجزیه و تحلیل آنها درست قبل از اینکه جامعه را در آغوش رویکرد جدید برای حفظ حریم خصوصی. “ما باید این فرصت را به اعتبار این که این نتایج با دیفرانسیل حریم خصوصی نزدیک به آن از جداول” مشتق شده با استفاده از قبلی راه هایی برای محافظت از حریم خصوصی او می گوید. “این همه پایین می آید به ایجاد حس اعتماد است.”

tinyurlis.gdv.gdv.htclck.ruulvis.netshrtco.dehec.su

نرم افزار گرامرلی

ایندکسر