نحوه کار سیستم تشخیص ترافیک تقلبی دژینو و آشنایی با این پلتفرم
فهرست مطلب
دژینو، یک پلتفرم ایرانی در زمینه تشخیص تقلب در تبلیغات کلیکی است. این پلتفرم، فعالیت خود در حوزه تشخیص تقلب در تبلیغات را از سال ۱۳۹۹ آغاز کرده و از فناوریهای هوش مصنوعی و یادگیری ماشین بهره گرفتهاست. تقریباً همه کسبوکارهایی که از طریق ادنتورکها یا گوگل ادز اقدام به تبلیغات کردهاند، متوجه تقلب در Sessionهای ورودی شدهاند و این موضوع، یکی از دغدغههای مهم کسبوکارها در تبلیغات آنلاین شده است.
دژینو عنوان میکند که برای بهبود این شرایط، از یک موتور هوش مصنوعی استفاده میکند. موتور هوش مصنوعی دژینو، هر سشن را به صورت لحظهای بررسی میکند. همچنین، این موتور هوش مصنوعی بر اساس گزارشهای مختلف، ترافیک ورودی از سورس، مدیوم و ناشران متقلب را شناسایی میکند.
سیستم تشخیص ترافیک تقلبی دژینو، هر سشن را بهطور مستقل در سه دستهبندی Profiling, Foot Print, User Behavior بررسی میکند و در نهایت به آن سشن، امتیازی بین صفر تا ده میدهد. بالا بودن امتیاز دریافت شده، احتمال نامعتبر بودن آن سشن را بیشتر میکند. بهعنوان مثال، سشنهایی که امتیاز آنها بالاتر از ۵ است، معمولاً باتهای متوسط و ساده هستند. پلتفرم دژینو، علاوه بر بررسی ترافیک ورودی، گزارش های مختلفی را از میزان ترافیک و ناشران نامعتبر ارائه میکند.
دژینو چیست؟
شرکت دانش بنیان پیشگامان دانش نوین دی با برند دژینو از سال ۱۳۹۹فعالیت خود را در سوله دیجینکست تهران آغاز کرده و پس از سرمایهگذاری دیجینکست بر روی آن، به توسعه تیم و محصول خود پرداخته است. تیم دژینو از مهندسان هوش مصنوعی، توسعهدهندگان وب و بازاریان دیجیتال تشکیل شده است. آنها تبلیغات آنلاین و بهخصوص تبلیغات کلیکی را در اکوسیستم استارتآپی ایران رصد میکنند تا با شناسایی نقاط ضعف و تهدیدها، خدماتی را برای مشتریان خود آماده کنند. دژینو علاوه بر ارائه سرویسهای کشف تقلب تبلیغاتی، در حوزه دیجیتال مارکتینگ به تولید محتوا میپردازد.
چالشها و راهحلهای کشف تقلب
در روشهای سنتی مقابله با تقلب، برای بهدست آوردن دادههای ضروری نیازمند صرف زمان و انرژی زیادی بود. باید با تحلیل دادهها، موارد غیرطبیعی را استخراج میکردیم و این شیوه در کمپینهای مهم که ناشران زیادی داشتند، زمان و نیروی کار بسیاری را میطلبید که در عمل غیر ممکن بود. بهدلیل طولانی شدن فرآیند تصمیمگیری راجع به ورودیهای مشکوک، امکان جلوگیری از ورودیهای نامعتبر کمپین فعلی وجود نداشت. از سوی دیگر، نمیتوانستیم بهراحتی به دادههای این کمپین اعتماد و برای کمپینهای بعدی از آن استفاده کنیم؛ چرا که عملکرد متقلبان، منابع و ناشران مختلف ماهبهماه تغییر میکرد.
این چالشها سبب اهمیت پلتفرمهای کشف تقلب (Fraud Detection Platforms) شد. این پلتفرمها، مشکلات پیش روی تبلیغات کلیکی در مراحل جمعآوری دیتا و آنالیز دادهها را برطرف میکنند. از جمله شرکتهای مطرح دنیا در زمینه مقابله با تقلب کلیکی، میتوان به Clickcease, Click Guard و Datadome اشاره کرد.
سیستم تشخیص تقلب دژینو چگونه کار میکند؟
همانطور که قبلا اشاره شد، سیستم تشخیص تقلب دژینو به این صورت است که هر Session ورودی به سایت در سه حوزه مختلف بررسی میشود که در هر کدام از لایههای مختلفی از الگوریتمها و مدلها ساخته شده است. در هر کدام از این الگوریتمها امتیازی به آن Session تعلق میگیرد. در پایان، این امتیازها با توجه به میزان تاثیرگذاری در تقلب، در یک فرمول محاسباتی وارد شده و امتیاز نهایی (از ۰ تا ۱۰) برای آن Session محاسبه میگردد و این امتیاز مبنای تصمیمگیری درباره باکیفیت یا بیکیفیت بودن آن خواهد بود.
تمامی Sessionهای ورودی از سورس، مدیوم، پابلیشر و کمپینهای مختلف با همین مکانیزم بررسی شده و امتیازدهی میشوند. با بهدست آمدن این دیتای اولیه بهصورت در لحظه، عملکرد منتشرکنندههای تبلیغ مشخص شده و به تبلیغدهنده اطلاعرسانی میشود. از جمله گزارشهایی که در این فرآیند ارائه میشود طبقهبندی میزان ترافیک باکیفیت و بیکیفیت سورسها، مدیومها، پابلیشرها و کمپینها بهصورت لحظهای است.
در ادامه برای درک بهتر، به معرفی سه حوزهای میپردازیم که Sessionها در آن بررسی میشوند:
- Profiling: در این بخش دیتاهای پروفایلی هر سشن بهعنوان داده خام وارد الگوریتمهای این بخش میشود؛ مواردی مانند IP کاربر، User agent مرورگر، استفاده از پروکسی و غیره. با توجه به خروجی هر هر الگوریتم امتیاز نهایی Session برای این بخش محاسبه میشود.
- Foot Print: در این شاخه الگوریتمها به دنبال الگوهای رفتاری مشکوک هستند. مواردی همچون تعداد دفعات ورود به سایت، الگوی ورود به سایت و… در فوت پرینت بررسی میگردد.
- User Behavior: در این شاخه نیز الگوریتم دژینو، رفتار کاربر اعم از محل کلیک، حرکت ماوس، میزان اسکرول و غیره را به الگوریتمهای رفتار کاربر داده و امتیاز این بخش را محاسبه میکند.
خدمات دژینو
استارتآپ دژینو، دو سرویس دیتکشن و پرفورمنس را ارائه میکند که در ادامه با آنها آشنا میشوید.
سرویس دیتکشن
سرویس دیتکشن با هدف ارائه خدمات کشف تقلب و بررسی ترافیک معتبر و نامعتبر راهاندازی شدهاست. اصلیترین بخش این سرویس، اطلاع از میزان معتبر بودن ترافیک ورودی است. بنابراین در سرویس دیتکشن هر session سایت در شاخههایی که بالا مطرح شد، ارزیابی میشود. از آنجاکه تمام ورودیها با utmهای تنظیم شده از سوی کسبوکار شناسایی میشوند، در پنلی که در اختیار کاربر قرار میگیرد،گزارش ترافیک معتبر و نامعتبر کمپین قابل مشاهده است. امتیاز تقلب بر اساس سورس، مدیوم، نام کمپین، نوع تبلیغ و نام پابلیشر اختصاص داده میشود و در نتیجه کسبوکارها میتوانند براساس هر مورد برای ادامه همکاری تصمیمگیری کنند.
گزارشهای ارائه شده از این قرارند:
- گزارش ترافیک معتبر و نامعتبر با دستهبندی utmهای مختلف
- گزارش ترافیک بر اساس سشن و یوزر
- امکان فیلتر کردن بر اساس سورس / مدیوم / کانتنت / کمپین
- مشاهده گزارش کلی یا به تفکیک لندینگ
- امکان استفاده از سیستم دیدبان (ست کردن سیستم آلارم در صورت نیاز)
سرویس پرفورمنس
این سرویس با هدف ارائه گزارشهای لازم و آلارمهای مناسب تصمیمگیری برای بهبود کمپین ایجاد شده است.
در سرویس پرفورمنس، اهداف و kpiهای لندینگ در کنار دادههای سرویس دیتکشن ارزیابی میشود. سورسها، مدیومها و انواع تبلیغها بهشرطی امتیاز مثبت دریافت میکنند که شامل اکشنهای مفید و واقعی باشند. هدف از این بررسیها، یافتن بهترین ورودیهاست. ورودیهایی که منجر به افزایش تعداد goal و بهبود شاخصهای کلیدی (KPI) در تمام قیف بازاریابی میشود. سرویس پرفورمنس، بهترین و بدترین منتشرکنندهها، ادنتورکها و منابع را بر اساس میزان تقلب، رفتار کاربر و هدف کمپین مشخص میکند. این سرویس علاوه بر سیستم دیتکشن که متمرکز بر تشخیص و حذف تقلب است، به سشنها امتیاز ارزشمند بودن نیز میدهد. گزارشدهیها در این سیستم در بازه زمانی مشخص در قالب فایلهای اکسل به صورت اتومات تولید و برای شما ایمیل میشود.
از مزایای این سرویس میتوان به موارد زیر اشاره کرد:
اکشن لیسنینگ چند لایه
بررسی وقوع یا عدم وقوع یک goal، وابستگی کامل به نحوه پیاده سازی لندینگ مورد بررسی دارد. با توجه به نوع پیاده سازی فنی یک لندینگ، امکان تشخیص وقوع یا عدم وقوع برخی از goalها توسط ابزارهای عمومی وجود ندارد.
سیستم اکشن لیسنینگ چندلایه دژینو، با توجه به ساختار هر لندینگ، با بررسی همزمان چند المان مختلف در صفحه، با دقت بالاتری وقوع یک goal را تشخیص میدهد.
رصد ترافیک بر اساس پارامترهای پرفورمنسی اختصاصی
در سرویس پرفورمنس، علاوه بر goalهای ست شده توسط کسبوکار، پارامترهای ترکیبی مختلفی توسط ترکر دژینو بررسی میشود.
اینکار باعث میشود تا سشنهایی که منجر به goal نهایی نشدهاند اما در عین حال از پتانسیل خوبی برای تبدیل برخوردار بودهاند، بررسی و رتبهبندی شوند. با اینکار کانالهایی که امکان وقوع goal در آنها در آینده بیشتر است شناسایی شده و در برنامهریزیهای آینده کمپین لحاظ خواهند شد.
بررسی پارامترهای نوین مبتنی بر هوش مصنوعی و فرمول بندی پرفورمنسی
برخی از پارامترهای پرفورمنسی مورد بررسی، با توجه به دیتای جمعآوری شده از کمپین تغییر میکنند.
همچنین فرمول نهایی محاسبه امتیاز پرفورمنسی به نوع کمپین، هدف کمپین و دیتای جمع آوری شده از کمپین حساس بوده و با توجه به آن برای هر کسبوکار تغییر خواهد نمود.
این واکنش پذیری فرمول امتیاز دهی به ترافیک هر لندینگ، نهایتا موجب بهبود دقت امتیازدهی و بهبود فرآیند تصمیمگیری در طول کمپین خواهد شد.
امتیازدهی فراد به اکشنها
می توان به تاثیر امتیاز تقلب در تصمیمگیری و پیشنهادات نهایی در سرویس پرفورمنس دژینو اشاره کرد. در نظر گرفتن امتیاز تقلب حتی برای سشنهایی که به goal منجر شدهاند، باعث تشخیص سشنهایی میشود که احتمال تقلبی بودن goal در آنها زیاد است.
goal تقلبی علیرغم تبدیل شدن، فاقد اعتبار است و در انتهای قیف بازایابی هزینه زیادی را به واحد ارتباط با مشتریان سازمانها وارد میکند.
تحلیل دیتا و ارائه خروجی منحصر به فرد
گزارشهای نهایی خروجی از سرویس پرفورمنس دژینو، با تحلیل تمامی دادههای ذکر شده در موارد قبل بهدست میآیند.
این گزارشها شامل مواردی از قبیل کانالهای موثر، کانال های غیر موثر، کانالهای خطرناک، پیشنهاد افزایش/کاهش بید و… میباشد.
حامیان دژینو
مرکز نوآوری و سرمایهگذاری گروه دیجیکالا، دیجی نکست، بر روی دژینو سرمایهگذاری کردهاند. این پلتفرم، از زمستان ۱۴۰۱ بهعنوان پروژهای دانشبنیان به ثبت رسیده و تحت حمایت معاونت علمی و فناوری نهاد ریاست جمهوری قرار گرفته است.
تقلب تبلیغاتی چقدر جدی است؟
به گزارش سایت humansecurity تقلب آنلاین در سال ۲۰۲۳ نسبت به قبل افزایش بیسابقهای داشته است. پایین آمدن کیفیت کلیکها هر ساله رو به افزایش است و انسانها روز به روز در این بازی نقش کمرنگتری پیدا میکنند. این در حالی است که سازمانها به دنبال جذب افراد واقعی و کلیکهای انسانیاند. ترافیک نامعتبر تنها بودجه کسبوکار را هدر میدهد. همین موضوع سبب شده موضوع شناسایی و مدیریت تقلب جدیتر پیگیری شود و ابزارهای کشف تقلب روی کار بیایند.
ترافیک معتبر انسانی سالانه ۲۸٪ کاهش یافته، اما ترافیک نامعتبر و مخرب رباتها ۱۰۲٪ در سال افزایش داشته است. بهعبارت دیگر درصد سرعتِ افزایش رباتهای بد از ترافیک کلی معتبر هم بیشتر بوده است.
در سال ۲۰۲۰ میلادی، ۲۳/۷ میلیارد دلار هزینه تقلب در بازاریابی دیجیتال بوده است. طبق آمار ۳۳٪ کلیکهایی که روی تبلیغات بنری میشود تقلبی است که این عدد در ایران به ۵۰ درصد هم میرسد. این در حالی است که تبلیغات بنری تنها بخشی از تبلیغات کلیکی محسوب میشود. گفتنیست، از هر ۵ کلیک نامعتبر، یک کلیک با vpn انجام شده است. بنابراین میتوان فیلترشکن را از متهمان اصلی تقلب تبلیغاتی معرفی کرد.
چرا خودمان نمیتوانیم کشف تقلب کنیم؟
هیچ کس دوست ندارد به کلیک فیک پول بدهد. اولین قدم در کشف تقلب شناسایی صحیح و به موقع تقلب است. به همین مناسبت کمپانی گوگل پرچمدار فراد دیتکشن بوده است. گوگل کلیکها را ابتدا بهصورت اتومات و بعد دستی رصد میکند و هزینه کلیکهای تقلبی ریفاند میشود ولی جای این سیستم در سرویسهای داخلی خالی است.
اگر تمامی نیروهای فنی سازمان را برای فراد دیتشکشن به کار بگیریم هزینهای بیشتر از کلیکهای فیک به خود تحمیل خواهیم کرد. ساخت سیستم کشف تقلب ارزان نیست. رباتها ممکن است در هر session رفتاری متفاوت از خود نشان بدهند. در ضمن متقلبها هر روز نوآوریهایی در تقلب رو میکنند و هیچ وقت از قافله عقب نمیمانند. الگوبرداری و کپی از روی سیستم دیتکشن هم فکری منطقی نیست چون هر کسبوکاری یک مدل سفارشی برای کشف تقلب نیاز دارد.