اولین هوش مصنوعی پاسخگو به زبان فارسی
از من بپرس
از من بپرس و جواب هر آنچه را که می خواهید در مورد جهان اطراف خود بدانید پیدا کنید. در مورد هر موضوعی سوال بپرسید و پاسخ بگیرید!
DarkBERT برای کشف رازهای در دل وب تاریک
برای درک بهتر از کارایی هوش مصنوعی DarkBERT و بررسی جایگاه وب تاریک در اینترنت قبل از هرچیز باید بدانیم وب تاریک در کجای اینترنت قرار دارد و اصطلاحا به چیز گفته میشود.
وب تاریک (Dark Web) یک قسمت ناشناخته و غیرقابل دسترس از اینترنت است که با استفاده از شبکههای مخفی و ابزارهای پنهانسازی، از دسترسی عموم مردم پنهان میشود. این بخش از اینترنت، که به طور عمده توسط مرورگر تور (Tor) قابل دسترسی است، فضایی است که فعالیتهای غیرقانونی و غیرمحرمانه از جمله فروش مواد مخدر، تجارت سلاح، قاچاق انسان و تجارت مستقیماً صورت میگیرد.
این وب تاریک معمولاً تحت پوشش حفاظتی قوی قرار دارد و عمدتاً به صورت ناشناس و ناشناخته فعالیت میکند. بنابراین، هنگامی که به وب تاریک اشاره میکنیم، به منظور نشان دادن فضایی از اینترنت با فعالیتها و محتواهای غیرقانونی و غیرمعمول اشاره داریم که از دید عمومی پنهان میماند.
حالا اگر مدلهای زبانی بزرگ (LLM) به کاوش در وب تاریک بپردازند، میتوانند به دامنههای اصلی موجود در اینترنت دسترسی پیدا کنند. تیمی از محققان کرهی جنوبی با استفاده از این روش، مدل هوش مصنوعی جدیدی با نام DarkBERT ساختهاند که بتواند برخی از دامنههای تاریکتر شبکه جهانی وب را فهرست کند. محققان ادعا میکنند که این ابزار میتواند در کشف و مبارزه با جرایم سایبری موثر باشد.
مدلهای زبانی بزرگ (Large Language Models – LLM) از جمله مدلهای هوش مصنوعی پیشرفته هستند که براساس مجموعههای بسیار بزرگی از دادههای زبانی آموزش میبینند. این مدلها با استفاده از شبکههای عصبی عمیق و تکنیکهای پردازش زبان طبیعی، قادر به تفسیر و تولید متنهای زبانی هستند.
LLMها برای آموزش خود از دادههای متنی متنوعی استفاده میکنند، از جمله مقالات علمی، رمانها، ویکیپدیا، متون اخبار و حتی پستهای رسانههای اجتماعی. این مدلها براساس آمار و الگوهای موجود در دادهها، مفاهیم و رابطههای زبانی را درک میکنند و قادر به تولید جملات جدید و پاسخ به سوالات زبانی هستند.
اهمیت LLMها در هوش مصنوعی نیز بسیار بزرگ است. آنها به ما امکان میدهند تا درک بهتری از زبان طبیعی و تعاملات انسانی داشته باشیم. آنها در حوزههایی مانند ترجمه ماشینی، خلاقیت متنی، پاسخ به سوالات، تولید محتوا، پشتیبانی مشتری و بسیاری از کاربردهای دیگر در هوش مصنوعی و بینایی ماشین بسیار مؤثر هستند.
با پیشرفت LLMها، تواناییهای آنها نیز افزایش یافته و میتوانند به طور همزمان با تعداد بیشتری از کلمات و مفاهیم زبانی کار کنند. با استفاده از این مدلها، میتوان به مسائل پیچیدهتری در حوزه هوش مصنوعی پرداخت و نقش مهمی در توسعه فناوریهای آینده داشت.
با گسترش استفاده از مدلهای زبان بزرگ (LLMs) مانند ChatGPT و Google Bard، محققان تصمیم گرفتند تا با استفاده از دادههای وب تاریک، یک مدل هوش مصنوعی جدید با نام DarkBERT را ایجاد کنند. در حالی که مدلهای قبلی بر مبنای دادههای اینترنت باز آموزش دیده بودند، DarkBERT تنها با دادههای وب تاریک آموزش داده شد. بدلیل محدودیتها و قوانینی که برای دسترسی به وب تاریک وجود دارد، DarkBERT به دلیل استفاده از دادههای تاریکتر، نقش جدیدی در مبارزه با جرایم سایبری و همچنین در فهم بهتر وب تاریک ایفا میکند.
یک مدل هوش مصنوعی جدید با نام DarkBERT با استفاده از دادههای وب تاریک که از هکرها و جنایتکاران سایبری استخراج شده است، آموزش داده شده است. محققان برای آموزش این مدل زبان جدید، به عمقهای وب تاریک رجوع کردند. پس از موفقیت ChatGPT شرکت OpenAI، Bing Chat شرکت مایکروسافت و Google Bard، محققان مدل هوش مصنوعی جدیدی را با یک چرخش تاریکتر ایجاد کردهاند. در حالی که مدلهای زبان بزرگ (LLMs) که ChatGPT و Google Bard را به قدرت میرسانند، بر روی دادههای بازار وب آموزش داده شدهاند، DarkBERT به طور انحصاری بر روی دادههای وب تاریک آموزش دیده است.
تیمی از محققان کره جنوبی مقالهای (PDF) منتشر کردهاند که در آن نحوه ساخت DarkBERT با استفاده از دادههای شبکه Tor، که اغلب برای دسترسی به وب تاریک استفاده میشود، را توضیح میدهند. با کرال در وب تاریک و سپس فیلتر کردن دادههای خام، آنها توانستند پایگاه دادهی وب تاریکی ایجاد کنند که آن را برای آموزش DarkBERT استفاده کردند. به طور شگفتآوری، DarkBERT با وجود آموزش داده شدن با دادههایی از یک مکان بسیار غیرمعمول، قادر شده است عملکرد دیگر مدلهای زبان بزرگ را برتری بخشد و به یک معماری هوش مصنوعی قدیمی، زندگی جدیدی بخشیده است.
اگرچه DarkBERT یک مدل هوش مصنوعی جدید است، در واقع بر مبنای معماری RoBERTa قرار دارد که یک رویکرد هوش مصنوعی است که در سال 2019 توسط محققان فیسبوک توسعه یافته است، بر اساس گزارش Tom’s Hardware.
در یک مقاله تحقیقی که جزئیات کارکرد داخلی RoBERTa را توضیح میدهد، Meta AI توضیح میدهد که این یک “روش بهینه سازی شده قدرتمند برای آماده سازی پیشآموزش سیستمهای پردازش زبان طبیعی (NLP)” است که بر روی BERT (نماینده نمایشگرهای رمزگذار دوطرفه از تبدیل کنندهها) که در سال 2018 توسط گوگل منتشر شد، بهبود میبخشد. از آنجا که گوگل BERT را به صورت منبع باز منتشر کرد، محققان فیسبوک توانستند عملکرد آن را در یک مطالعه تکراری بهبود بخشند.
از روش بهینه سازی شده فیسبوک، RoBERTa را منتشر کرد که توانست نتایج برجستهای در معیار GLUE (ارزیابی درک زبان عمومی) NLP ارائه دهد.
اما اکنون، محققان کرهای پشت دارکبرت نشان دادهاند که RoBERTa قادر است کارهای بیشتری را انجام دهد زیرا در زمان انتشار اولیه آموزش ندیده بود. با تغذیه RoBERTa از دادههای وب تاریک در طی تقریباً 16 روز در دو مجموعه داده (یکی خام و دیگری پیشپردازش شده)، محققان توانستند دارکبرت را ایجاد کنند، ولی محققان هیچ نقشهای برای انتشار DarkBERT به عموم مردم ندارند. با این حال، آنها درخواستهایی را برای اهداف تحصیلی میپذیرند. با این حال، DarkBERT احتمالاً به قوانین و نیروهای انتظامی و محققان در درک بهتری از وب تاریک در کل کمک خواهد کرد.
DarkBERT میتواند در بسیاری از حوزهها کاربرد داشته باشد، اینگونه کاربردها عبارتند از:
DarkBERT در واقع بر اساس معماری RoBERTa توسعه داده شده است که در سال 2019 توسط محققان فیسبوک ارائه شد. RoBERTa یک رویکرد بهینه شده و قدرتمند برای پیشآموزش سیستمهای پردازش زبان طبیعی است که در برابر BERT بهبودهای قابل توجهی داشت. این بهبودها شامل بهبود در آموزش، استفاده از حجم بیشتری از دادهها و استفاده از تکنیکهای بهتر برای پیشپردازش دادهها میشود.با استفاده از روش بهینه شده RoBERTa، محققان توانستند DarkBERT را ایجاد کنند. DarkBERT در واقع نسخه ارتقا یافتهای از RoBERTa است که با آموزش بر روی دادههای وب تاریک، قابلیتها و کارایی آن را بهبود بخشیده است.
DarkBERT با الگوریتم هوش مصنوعی BERT در چند جنبه تفاوت دارد:
از نظر معماری و فرایند آموزش، DarkBERT بر اساس معماری RoBERTa توسعه داده شده است که از روشهای بهبود یافته برای پیشآموزش سیستمهای پردازش زبان طبیعی استفاده میکند. این بهبودها شامل بهینهسازی آموزش، استفاده از حجم بیشتری از دادهها و بهرهگیری از روشهای بهتر برای پیشپردازش دادهها است.
در آینده، مدلهای مشابه DarkBERT که با تمرکز بر یک حوزه خاص آموزش دیده شدهاند، ممکن است توسعه پیدا کنند. این مدلهای هوش مصنوعی متخصص تری در زمینههای خاص ارائه خواهند کرد و به نوعی نیازها و تقاضاهای خاص صنایع و بخشهای مختلف را برطرف میکنند. همچنین، با پیشرفت این مدلها، قابلیتها و دقت آنها نیز بهبود خواهد یافت که میتواند در بسیاری از زمینهها مانند تحقیقات علمی، امنیت سایبری، پشتیبانی مشتری و سیستمهای هوشمند، تأثیرگذار باشد.
نتیجهگیری:
دارکبرت با استفاده از دادههای وب تاریک، یک مدل هوش مصنوعی جدید و کارآمد را ایجاد کرده است که از سایر مدلهای مشابه درک بهتری از وب تاریک ارائه میدهد. این تحقیق به ما نشان میدهد که استفاده از دادههای وب تاریک میتواند بهبودهای قابل توجهی در آموزش مدلهای هوش مصنوعی به دست آورد و تواناییهای بیشتری در برابر جرایم سایبری و تهدیدات وب تاریک به ما ارائه دهد.
از این هشتگ ها در رسانه ها استفاده کنید:
ایرانسلی ها رایگان فیلم ببینید
حجم مصرفی نیم بها با خرید اشتراک | هزینه ماهیانه کمتر از یک بلیط سینما
uperaplus.online
اولین هوش مصنوعی پاسخگو به زبان فارسی
از من بپرس و جواب هر آنچه را که می خواهید در مورد جهان اطراف خود بدانید پیدا کنید. در مورد هر موضوعی سوال بپرسید و پاسخ بگیرید!