تشخیص مدولاسیون خودکار تعمیم‌یافته برای شبکه‌های رادیویی شناختی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار گروه مخابرات، دانشکده برق و کامپیوتر، دانشگاه جامع امام حسین (ع)، تهران، ایران

2 دانشجوی کارشناسی ارشد مخابرات سیستم، دانشکده رایانه، شبکه و ارتباطات، دانشگاه جامع امام حسین (ع)، تهران

3 استادیار گروه ارتباطات و شبکه، دانشکده رایانه، شبکه و ارتباطات، دانشگاه جامع امام حسین (ع)، تهران، ایران

چکیده

دسته‌بندی مدولاسیون خودکار (AMC) نقشی اساسی در سیستم‌های ارتباطی دفاعی و نظامی ایفا می‌کند، به ویژه در سناریوهایی که سازگاری، انعطاف‌پذیری و قابلیت اطمینان حیاتی هستند. در شبکه‌های رادیویی شناختی، AMC شناسایی بلادرنگ طرح‌های مدولاسیون را امکان‌پذیر می‌سازد، که برای نظارت موثر طیف، کاهش تداخل، و ارتباطات امن در محیط‌های پویا و رقابتی ضروری است.
در این مطالعه با توسعه یک شبکه عصبی کانولوشنال تطبیقی با کیفیت سیگنال (SQACNN)، مدلی برای دسته‌بندی دقیق‌تر و مقاوم‌تر مدولاسیون‌های سیگنال رادیویی ارائه داده است. هدف اصلی، ایجاد مدلی است که با کیفیت سیگنال‌های ورودی هماهنگ شود و تأثیر نویز را کاهش دهد. بدین منظور، از تابع زیان تطبیقی استفاده شده تا زیان آنتروپی متقاطع را با عوامل منظم‌سازی، شامل ضریب پخش‌شدگی سیگنال، ضریب فشردگی ویژگی و ضریب تنظیم SNR ترکیب کند.
با استفاده از مجموعه‌داده ارزیابی، دقت دسته‌بندی مدل در طول SNR های مختلف مورد ارزیابی قرار گرفت که مشاهده گردید، مدل پیشنهادی SQACNNدارای پیشرفت‌های چشمگیری در دقت دسته‌بندی با دقت کلی 03/71 درصد و همچنین با حفظ دقت مطلوب به‌خصوص در شرایط SNR پایین، استحکام و پایداری مدل مورد تایید می‌گیرد. این تحقیق نشان‌دهنده اثربخشی ترکیب معیارهای کیفیت سیگنال در فرایند یادگیری است و آن را به ابزاری مفید برای کاربردهای پردازش سیگنال در دنیای واقعی تبدیل می‌کند

کلیدواژه‌ها

موضوعات


مقدمه

پیشرفت سریع در استانداردها و فناوری‌های متنوع ارتباطات بی‌سیم، درک دقیق از طیف رادیویی را ضروری می‌سازد که برای مواردی چون جنگ الکترونیک، تحلیل تهدیدات نظامی و دسترسی به طیف پویا و شناسایی تداخل در محیط‌های غیرنظامی حیاتی است. بااین‌وجود، استفاده گسترده از طیف در شبکه‌های متراکم متصل، برای پشتیبانی از حجم بالای ترافیک در سیستم‌های بی‌سیم، به مشکلاتی مانند تداخل کانال‌های مشترک و تحریف سیگنال منجر می‌شود. علاوه بر این، سیستم‌های ارتباطی پیشرفته معمولاً از پیکربندی‌های غیرهمکاری برای مدیریت هوشمندانه طیف استفاده می‌کنند که در آن سیگنال‌های رادیویی با استفاده از انواع شکل‌های مدولاسیون بر اساس نیازهای سیستم و شرایط کانال کدگذاری می‌شوند. شناسایی خودکار نوع مدولاسیون سیگنال‌های دریافتی برای گیرنده‌ها ضروری است تا بتوانند سیگنال را به‌درستی دریافت کنند و توسعه الگوریتم‌های کارآمد شناسایی مدولاسیون را به یک اولویت در ارتباطات رادیویی تعریف شده توسط نرم‌افزار تبدیل می‌کند.

دسته‌بندی مدولاسیون خودکار[1] (AMC) که پیش از دمدولاسیون سیگنال در لایه فیزیکی قرار دارد، در حال حاضر موردتوجه فزاینده‌ای در جامعه پردازش سیگنال و ارتباطات قرار گرفته است. هدف اصلی AMC، دسته‌بندی نوع مدولاسیون سیگنال‌های دریافتی در گیرنده است که در واقع این عملیات یک فرایند تصمیم‌گیری چند کلاسه در زمینه هوش مصنوعی محسوب می‌شود. ویژگی‌های سیگنال رادیویی، ازجمله اطلاعات مدولاسیون، می‌توانند از طریق روش‌های مهندسی ویژگی‌های رایج مانند استخراج و انتخاب ویژگی، برای آموزش مدل‌های دسته‌بندی از طریق یادگیری ماشین نظارت شده یا بدون نظارت شناسایی شوند (Pham et al., 2021).

چالش اصلی، دسته‌بندی دقیق سیگنال‌ها در شرایط متفاوت و غالباً نامساعد، مانند نسبت سیگنال به نویز پایین[2] (SNR) و تداخلات است که روش‌های مرسوم اغلب در مدیریت آن‌ها ناموفق می‌مانند. این مطالعه به دنبال توسعه مدلی قدرتمند در حوزه یادگیری عمیق است که بتواند به‌طور مؤثر مدولاسیون‌های سیگنال‌های رادیویی را در طیف وسیعی از سطوح SNR دسته‌بندی کند و در نتیجه، کارایی و اطمینان سیستم‌های ارتباطی بی‌سیم را به‌خصوص در شبکه‌های رادیویی شناختی بهبود بخشد.

اهمیت دسته‌بندی مدولاسیون دقیق را نمی‌توان نادیده گرفت. این امر نقشی حیاتی در تضمین استفاده بهینه از طیف، کاهش تداخل، افزایش امنیت و بهبود کارایی کلی سیستم‌های ارتباطی دارد. به‌عنوان‌مثال، در شبکه‌های رادیویی شناختی، دسته‌بندی خودکار مدولاسیون، دسترسی مطمئن به طیف پویا را فراهم می‌آورد که برای رفع کمبود طیف حیاتی است. همچنین در کاربردهای نظامی، دسته‌بندی مدولاسیون دقیق می‌تواند به شناسایی و رهگیری انتقال داده‌های غیرمجاز کمک کند.

کاربرد دفاعی برجسته AMC در «جنگ الکترونیک»[3] نهفته است. با تشخیص سریع مدولاسیون سیگنال‌های رهگیری شده، AMC به سیستم‌های نظامی اجازه می‌دهد تا تهدیدات بالقوه مانند تلاش‌های پارازیت یا جعل را شناسایی و مقابله کنند. علاوه بر این، AMC از عملیات اطلاعاتی، نظارتی و شناسایی[4] (ISR) با ارائه بینش در مورد الگوهای ارتباطی متخاصم و پروتکل‌های زیربنایی آن‌ها پشتیبانی می‌کند.

علاوه بر این، AMC عملکرد شبکه‌های ارتباطی میدان نبرد را با امکان اشتراک‌گذاری و مدیریت یکپارچه طیف افزایش می‌دهد. این امر به‌ویژه در سناریوهایی که طیف الکترومغناطیسی به‌شدت شلوغ است بسیار مهم است؛ زیرا AMC امکان مدولاسیون تطبیقی و استراتژی‌های کدگذاری را فراهم می‌کند و استفاده کارآمد از طیف را در عین حفظ قابلیت اطمینان ارتباطات تضمین می‌کند. این برنامه‌ها بر اهمیت استراتژیک AMC در سیستم‌های دفاعی مدرن تأکید می‌کنند و آن را به یک فناوری اساسی برای شبکه‌های رادیویی شناختی در حوزه‌های نظامی و امنیتی تبدیل می‌کنند.

 

 

  1. پیشینه پژوهش

دسته‌بندی مدولاسیون دارای تاریخچه‌ای غنی است که ریشه در رویکردهای مبتنی بر نظریه‌های احتمال، مدل‌های فرضیه و روش‌های پردازش سیگنال رایج در دهه 1990 دارد. یکی از اولین روش‌ها، رویکردی بود که بر پایه ویژگی‌های چرخه‌ای استوار بود و در سال 1994 توسط «گاردنر»[5] معرفی شد که از تناوب‌های ذاتی سیگنال‌های مدوله استفاده می‌کرد (Gardner, 1994). این روش، با وجود نوآوری، نیازمند طراحی ویژگی‌های پیچیده‌ای بود و نسبت به نویز و تغییرات شرایط سیگنال حساسیت داشت.

با پیدایش یادگیری ماشین، محققان به بررسی الگوریتم‌هایی نظیر ماشین‌های بردار پشتیبان[6] (SVM) و  K- نزدیک‌ترین همسایگان[7] (KNN) پرداختند. به‌عنوان نمونه، «دوبره»[8] و همکارانش در سال 2007، مروری جامع بر روش‌های یادگیری ماشینی که در AMC به‌کاررفته‌اند، ارائه دادند و بر استفاده از آمارگان مرتبه بالا و تجمع‌دهنده‌ها به‌عنوان ویژگی‌های کلیدی تأکید کردند (Dobre et al., 2007). با این وجود، این روش‌ها هنوز به‌طور گسترده‌ای به ویژگی‌های استخراج شده به‌صورت دستی وابسته بودند و در شرایط دارای اختلال با چالش‌هایی روبه‌رو شدند.

ظهور «یادگیری عمیق»[9] (DL) تحول قابل‌توجهی را در AMC به ارمغان آورد. «شبکه‌های عصبی کانولوشنال»[10] (CNN) به دلیل توانایی خود در استخراج خودکار ویژگی‌های مهم از داده‌های سیگنال خام محبوبیت پیدا کردند. در سال 2016، اُشی و همکاران (O’Shea et al., 2016) یک رویکرد مبتنی بر CNN ارائه کردند که از روش‌های متداول رایج در طبقه‌بندی 11 نوع مدولاسیون مختلف بهتر عمل کرد؛ کار آن‌ها توانایی یادگیری عمیق را برای مدیریت پیچیدگی و تنوع سیگنال‌های دنیای واقعی نشان داد.

در سال 2018 ژانگ و سابونکو (Zhang & Sabuncu, 2018) یک روش جدید هم‌جوشی مدل عمیق ناهمگن[11] (HDMF) ابداع کردند که نقاط قوت CNN و «حافظه بلندمدت»[12] (LSTM) را برای افزایش استخراج ویژگی در داده‌های سری زمانی ادغام می‌کند. هوانگ و همکاران (Huang et al., 2020) در سال 2020 بر روی روش‌های تقویت داده‌ها برای افزایش تعمیم و استحکام مدل با تولید نمونه‌های مصنوعی که تغییرات دنیای واقعی را شبیه‌سازی می‌کنند، تمرکز کردند. در سال 2021 نیز لو و همکاران (Lu et al., 2021) مدل شبکه عصبی عمیق و باقی‌مانده کوتاه‌مدت کانولوشنال[13] (CLDR) را برای دسته‌بندی مدولاسیون معرفی کردند. با ترکیب شبکه‌های عصبی کانولوشن و «شبکه‌های باقی‌مانده»[14]،CLDR به مناسبی در محیط‌های پراختلال دست می‌یابد. قابل ذکر است، یک روش نرخ یادگیری چرخه‌ای تطبیقی، کارایی آموزش را افزایش می‌دهد.  مطالعات اخیر برای پیشرفت این رشته ادامه داشته است. برای مثال در سال 2023 وانگ و همکاران (Wang et al., 2023) یک رویکرد مبتنی بر «شبکه عصبی گراف»[15] (GNN) برای دسته‌بندی مدولاسیون، با استفاده از ساختار نمودار ذاتی داده‌های سیگنال پیشنهاد کردند. روش آن‌ها به‌طور مؤثر روابط پیچیده درون داده‌ها را ثبت کرد که منجر به‌دقت دسته‌بندی و استحکام بالاتر در برابر نویز شد.

با وجود این پیشرفت‌ها، چالش دسته‌بندی دقیق مدولاسیون‌ها در محیط‌های پُر اختلال همچنان ادامه دارد. مدل‌های موجود اغلب نرخ‌های دسته‌بندی اشتباه قابل‌توجهی را تحت سطوح مختلف SNR نشان می‌دهند.

 

  1. مدل سیستم

2-1. رادیو شناختی

«رادیو شناختی»[16] یک فناوری ارتباطات بی‌سیم پیشرفته است که برای افزایش استفاده از طیف فرکانس رادیویی طراحی شده است. در سیستم‌های رادیویی شناختی، تخصیص طیف به‌صورت پویا و هوشمندانه انجام می‌شود. به عبارت دیگر، این سیستم‌ها به کاربران بدون مجوز (کاربران ثانویه) اجازه می‌دهند تا از باندهای کم استفاده ‌شده بدون تداخل با کاربران دارای مجوز (کاربران اصلی) استفاده کنند. این تطبیق پویا با استفاده از درک محیط، تحلیل پارامترهای انتقال و یادگیری از محیط انجام می‌شود (Ding et al., 2017).

ازجمله کاربردهای رادیو شناختی می‌توان به موارد زیر اشاره کرد (Ding et al., 2017) :

  • دسترسی به طیف پویا: امکان دسترسی کاربران به باندهای طیفی کم‌استفاده یا بی‌استفاده بدون تداخل که کارایی طیف را بهبود می‌بخشد و از خدمات ارتباطی بی‌سیم پشتیبانی می‌کند؛
  • امنیت عمومی و شبکه‌های اضطراری: فراهم‌کردن کانال‌های ارتباطی قوی و انعطاف‌پذیر برای امدادگران در شرایط بحرانی با استفاده از طیف‌های موجود؛
  • شبکه‌های حسگر بی‌سیم: افزایش کارایی و قابلیت اطمینان این شبکه‌ها از طریق تطبیق پویا با شرایط طیف، مفید برای سیستم‌های نظارت و کنترل محیطی و صنعتی؛
  • اینترنت اشیا و شبکه‌های هوشمند: پشتیبانی از اتصال تعداد زیادی دستگاه متصل‌به‌هم در «اینترنت اشیا»[17] و شبکه‌های هوشمند با ارتباط تطبیقی و کارآمد.

AMC یک جزء حیاتی در سیستم‌های رادیویی شناختی است. AMC فرایند شناسایی طرح مدولاسیون سیگنال دریافتی بدون اطلاع قبلی از پارامترهای سیگنال ارسالی است. نقش AMC در رادیو شناختی را می‌توان به شرح زیر بیان کرد (Ding et al., 2017) :

  • سنجش و شناسایی طیف: شناسایی طرح مدولاسیون سیگنال‌ها برای تشخیص کاربران اولیه و ارزیابی اشغال طیف، جلوگیری از تداخل و تصمیم‌گیری هوشمندانه در دسترسی به طیف؛
  • سازگاری و پیکربندی مجدد: تطبیق پارامترهای انتقال رادیوهای شناختی با تغییرات مدولاسیون کاربران اصلی برای حفظ ارتباط کارآمد؛
  • افزایش قابلیت اطمینان ارتباطات: بهبود تفسیر سیگنال‌ها و ارتباطات قوی‌تر و بدون خطا با دسته‌بندی دقیق مدولاسیون؛
  • بهره‌وری طیف: انتخاب مناسب‌ترین کانال‌ها و پارامترهای انتقال با شناسایی دقیق مدولاسیون‌ها برای استفاده کارآمد از طیف؛
  • کاهش تداخل: شناسایی و کاهش منابع تداخل با استفاده از دسته‌بندی مدولاسیون.

رادیو شناختی نشان‌دهنده پیشرفت قابل ‌توجهی در فناوری ارتباطات بی‌سیم است که امکان استفاده کارآمدتر و هوشمندانه‌تر از طیف فرکانس رادیویی را فراهم می‌کند. AMC نقش مهمی در بهبود سنجش طیف، سازگاری، قابلیت اطمینان، کارایی و کاهش تداخل در رادیوهای شناختی دارد و به کارکرد مستقل و انعطاف‌پذیر این سیستم‌ها در محیط‌های پویا و متنوع کمک می‌کند.

 

2-2. مدل سیستم

سیستم ارتباطی بی‌سیم مبتنی بر AMC همان‌طور که در شکل (1)، مشخص شده است متشکل از فرستنده سیگنال، کانال ارسالی و گیرنده سیگنال است.

 

شکل 1: سیستم ارتباطی بی‌سیم بر اساس AMC پیشنهادی

رابطه سیگنال دریافتی r(t) در گیرنده سیگنال به‌صورت زیر خواهد بود:

(1)

 

سیگنال ورودی  ابتدا توسط تابع مدولاسیون  به سیگنال مدوله  تبدیل شده و پس از آن از طریق کانال ارتباطی  به گیرنده منتقل می‌شود.  نیز «نویز جمع‌شونده سفید گوسی»[18] است که با سیگنال ارسالی از کانال جمع می‌شود و در نهایت سیگنال دریافتی  تشکیل می‌شود.

کانال ارتباطی  نیز، یک کانال با محوشدگی چندمسیره انتخابی رایسین خواهد بود که به مشخصه زیر است:

(2)

 

در این معادله،  عامل  ام رایسین (نسبت «توان دید مستقیم»[19] به توان پراکنده)،  فاز مؤلفه،  تأخیر مؤلفه،  بهره مختلط مؤلفه چند مسیره  ام،  فاز مؤلفه چند مسیری  ام و  شکل پالس اجزای چند مسیری را نشان می‌دهند.

برای سیگنال رادیویی دریافتی ، AMC به‌عنوان یک فرایند میانی بین تشخیص و دمدولاسیون در گیرنده عمل می‌کند. هدف پیش‌بینی الگوی مدولاسیون سیگنال‌های دریافتی، یعنی تابع  و سپس ارائه اطلاعات مدولاسیون برای بازیابی سیگنال دمدوله شده  از سیگنال دریافتی  است. به بیان دیگر وظیفه AMC را می‌توان به‌عنوان یک مسئله دسته‌بندی در یادگیری ماشین تلقی کرد؛ جایی که ورودی‌ها، توالی‌های زمانی پیچیده باند پایه سیگنال‌های رادیویی دریافتی و خروجی‌ها، الگوهای مدولاسیون مربوط به آن‌ها هستند.

 

2-3. مجموعه داده مورد استفاده

مجموعه داده استفاده‌شده، مجموعه داده RadioML2016.10a است (Shea & West, 2016). این مجموعه داده یک مجموعه‌ای از سیگنال‌های ارتباطی است که با استفاده از «رادیو گنو»[20] با دقت ساخته شده‌اند. مشخصات این مجموعه داده در ادامه و در جدول (1)، مشخص است.

جدول 1: مشخصات مجموعه داده RadioML2016.10a

تعداد مدولاسیون‌ها

11

شکل‌های مدولاسیون

BPSK, QPSK, 8-PSK, 16QAM, 64QAM, 4PAM, GFSK, CPFSK, WBFM, AM-SSB, AM-DSB

طول سیگنال

128 نمونه مختلط

محدوده SNR

dB 20: 2: 20-

تعداد کل سیگنال‌ها

165000

مشخصات کانال ارسالی

محوشدگی چند مسیری انتخابی[21]

انحراف نرخ نمونه[22]

انحراف فرکانس مرکزی[23]

نویز جمع‌شونده سفید گوسی

سیگنال‌ها در این مجموعه داده به طول 128 نمونه و به‌صورت IQ هستند. به‌طوری‌که هر سیگنال دارای ابعاد (128 و 2) است. فرم نمایشی  سیگنال n ام در مجموعه داده، به‌صورت زیر خواهد بود:

(3)

 

در این رابطه، S نشان‌دهنده تعداد نمونه‌ها است. همچنین نوع مدولاسیون‌های هر یک از سیگنال‌ها نیز در یک آرایه به ابعاد (165000 و 1) مشخص شده‌اند:

(4)

 

در این رابطه، C تعداد کل مدولاسیون‌های موجود در مجموعه داده را نشان می‌دهد و N نیز تعداد کل سیگنال‌های موجود را مشخص می‌کند.

از کل تعداد سیگنال‌های موجود در مجموعه داده، 70% برای آموزش، 15% برای اعتبارسنجی و 15% نیز برای ارزیابی استفاده شده‌اند.

 

  1. مدل پیشنهادی

3-1. شبکه عصبی کانولوشنال

شبکه‌های عصبی، الهام‌گرفته از مغز انسان، مدل‌های محاسباتی برای تشخیص الگوها و حل مسائل پیچیده هستند. شبکه‌های عصبی کانولوشنال، نوعی تخصصی از این شبکه‌ها برای پردازش داده‌های ساختاریافته، مانند تصاویر و سیگنال‌ها، هستند. ساختار CNN شامل سه عنصر کلیدی کانولوشن، تابع فعال‌سازی غیرخطی و ادغام (نمونه‌برداری کاهشی) است. مزیت‌های CNN عبارتند از (Pham et al., 2021):

  • تعاملات پراکنده: استفاده از هسته‌های کوچک‌تر از ورودی برای افزایش کارایی ذخیره‌سازی و عملکرد آماری؛
  • اشتراک‌گذاری پارامتر: اعمال هسته بر کل ورودی برای تولید نقشه ویژگی؛
  • تغییرناپذیری نسبت به ترجمه‌های ورودی: عملیات کانولوشن و ادغام، CNN ها را به این ویژگی می‌رساند؛
  • استخراج خودکار ویژگی‌های سطح بالا: برای استخراج اطلاعات ضروری.

در طول فرایند آموزش، شبکه‌های عصبی کانولوشنی از تابع زیان برای سنجش اختلاف بین پیش‌بینی‌های خود و برچسب‌های صحیح استفاده می‌کنند. تابع زیان رایج برای مسائل دسته‌بندی، «آنتروپی متقاطع»[24] است که رابطه آن به شرح زیر است (Ian Goodfellow, 2016):

(5)

 

که در آن  برابر با برچسب‌های صحیح و  نیز پیش‌بینی‌های مدل است.

 

3-2. ساختار مدل پیشنهادی

مدل پیشنهادی «SQACNN»[25] با چندین لایه کانولوشنی ساخته شده است که هر یک برای استخراج ویژگی‌های مهم از سیگنال‌های ورودی طراحی شده‌اند. این معماری در جدول (2)، قابل مشاهده است. لایه‌های استفاده شده در این مدل عبارتند از: «لایه‌های کانولوشن یک‌بُعدی»، «لایه‌های ادغام یک‌بُعدی»، «لایه‌های نرمال‌سازی دسته‌ای»، «لایه‌های کاملاً متصل» و «لایه حذف تصادفی.»

در این مدل از لایه‌های کانولوشن یک‌بُعدی (Conv1D) استفاده ‌شده که اغلب در مدل‌های یادگیری عمیق برای داده‌های توالی‌ مانند سری‌های زمانی، سیگنال‌های صوتی و متون به کار می‌روند (Ian Goodfellow, 2016).

لایه‌های ادغام، اجزای حیاتی در معماری شبکه‌های عصبی کانولوشنی هستند. آن‌ها به کاهش ابعاد فضایی کمک می‌کنند، ضمن اینکه ویژگی‌های مهم داده‌های ورودی را حفظ می‌نمایند (Ian Goodfellow, 2016).

استفاده از لایه‌های نرمال‌سازی دسته‌ای برای آموزش پایدار و کارآمد حیاتی است. این فرایند شامل مقیاس‌بندی ویژگی‌ها برای رسیدن به میانگین صفر و واریانس واحد است. نرمال‌سازی به جلوگیری از مشکلات ناپدید شدن یا انفجار گرادیان‌ها کمک می‌کند که می‌تواند مانع از همگرایی در طول آموزش شود (Ioffe & Szegedy, 2015).

لایه کاملاً متصل، هر نورون (واحد) را از لایه قبلی به هر نورون در لایه فعلی متصل می‌کند. این ساده‌ترین نوع لایه است که در آن هر ویژگی ورودی به هر ویژگی خروجی کمک می‌کند.

جدول2: ساختار معماری مدل پیشنهادی

لایه‌ها

اندازه خروجی

پارامترها

ورودی

128×2

-

کانولوشون یک‌بُعدی 1

64×125×2

192

نرمال‌ساز دسته‌ای

-

-

کانولوشون یک‌بُعدی 2

64×124×2

192

نرمال‌ساز دسته‌ای

-

-

ادغام حداکثری یک‌بُعدی 1

64×62×2

-

کانولوشون یک‌بُعدی 3

128×61×2

73856

نرمال‌ساز دسته‌ای

-

-

کانولوشون یک‌بُعدی 4

128×60×1

73856

نرمال‌ساز دسته‌ای

-

-

ادغام حداکثری یک‌بُعدی 2

128×30×1

-

کانولوشون یک‌بُعدی 5

256×29×1

295168

لایه‌ها

اندازه خروجی

پارامترها

نرمال‌ساز دسته‌ای

-

-

کانولوشون یک‌بُعدی 6

256×28×1

295168

نرمال‌ساز دسته‌ای

-

-

ادغام حداکثری یک‌بُعدی 3

256×14×1

-

کانولوشون یک‌بُعدی 7

512×13×1

1180170

نرمال‌ساز دسته‌ای

-

-

ادغام میانگین سراسری یک‌بُعدی

512×1

-

حذف تصادفی (4/0)

-

-

کاملاً متصل 1

256×1

131328

کاملاً متصل 2

128×1

32896

کاملاً متصل 3

64×1

8256

خروجی

11×1

715

تعداد کل مقادیر

-

1819363

 

 

 

 

 

 

 

 

 

 

 

 

لایه‌های «حذف تصادفی»[26] نیز به‌عنوان یک نوع منظم‌سازی عمل می‌کند که از بیش برازش جلوگیری می‌کند. در طول آموزش، حذف تصادفی به‌صورت تصادفی بخشی از خروجی‌های نورون‌ها را صفر می‌کند (آن‌ها را حذف می‌کند) (Srivastava et al., 2014).

 

3-3. آموزش مدل پیشنهادی

سیگنال‌های موجود در مجموعه داده پس از آماده‌سازی و انجام عملیات پیش‌پردازشی لازم همانند نرمال‌سازی، بُر زدن[27]، قرار دادن در دسته‌های ۶۴ تایی آماده ورود به مدل برای آموزش خواهند بود. طرح کلی آموزش مدل در شکل (2)، نمایان است.

 

شکل 2: فرایند آموزش مدل پیشنهادی

برای دستیابی به تابع زیان (ضرر) تطبیقی مورد نظر، لازم است که سه تابع برای محاسبه «ضرایب پخش سیگنال»[28]، «فشردگی ویژگی»[29]‌ و «تنظیم SNR»[30] و کارایی آن‌ها و نحوه به‌کارگیری‌شان در تابع زیان پرداخته می‌شود. در این بخش، برای نوشتن توابع از مرجع (Zheng et al., 2023) الهام گرفته شده است.

 

3-3-1. ضریب تنظیم SNR

در مجموعه داده ، فرض می‌کنیم به تعداد  نمونه با نرخ SNR بزرگ‌تر از آستانه  به عبارتی  و نیز به تعداد  نمونه با نرخ SNR کم‌تر از آستانه  به عبارتی  داریم که مجموع این دو برابر با  است. آستانه را می‌توان به‌عنوان میانگین انحراف SNR تمام نمونه‌ها تعریف کرد که محاسبه آن به شکل زیر است (Zheng et al., 2023):

(6)

 

که در آن 𝜖 یک ضریب برای انحراف آستانه است که می‌توان به‌صورت دستی آن را تنظیم کرد.

به‌طور مشابه، تعداد نمونه‌های مثبت و منفی در یک دسته کوچک به‌صورت  و  فرض می‌شود که مجموع آن‌ها برابر M است. در این صورت تابع زیان وزن‌دِهی شده در ، دسته t ام مجموعه داده، برابر است با (Zheng et al., 2023):

(7)

 

که  تابع زیان آنتروپی متقاطع ذکر شده در معادله (3-7) و  ضریب تنظیم SNR، به شرح زیر است (Zheng et al., 2023):

(8)

 

با فرض اینکه سیگنال‌های دریافتی مستقل از یکدیگر هستند، ضریب تنظیم SNR، در  یک متغیر دوگانه است که توزیع زیر را برآورده می‌کند (Zheng et al., 2023):

(9)

 

می‌توان نتیجه گرفت که زمانی که نمونه‌ها در یک دسته کوچک دارای SNR های متفاوت هستند، ضریب تنظیم SNR برای نمونه‌های مثبت بیش از یک است و در نتیجه تابع زیان و جهت گرادیان آن‌ها تقویت می‌شود. در مقابل، ضریب تنظیم SNR برای نمونه‌های منفی کمتر از یک است و تابع زیان و جهت گرادیان آن‌ها تضعیف می‌شود. این امر باعث می‌شود تا فاصله بین کلاسی برای سیگنال‌های با SNR های مختلف افزایش یابد و به تصمیم‌گیری تطبیقی و تعمیم‌پذیری بیشتری منجر شود. همچنین با ایجاد نمونه‌های فشرده‌تر درون کلاسی به افزایش فاصله بین کلاسی کمک می‌کنند که این امر به کاهش محدودیت‌ها در تشکیل مرزهای تصمیم‌گیری در مدل‌های یادگیری عمیق منجر می‌شود.

3-3-2. ضریب پخش سیگنال

تابع ضریب پخش سیگنال، تغییرات نمونه‌ها را در یک دسته بر اساس میانگین آن‌ها محاسبه می‌کند. این برای فهمیدن میزان گسترش یا پراکندگی کلی داده‌ها در یک دسته به کار می‌رود. رابطه آن به شکل زیر خواهد بود:

(10)

 

که در آن  بیانگر نمونه i-ام در دسته و  نیز بیانگر میانگین دسته است. رابطه  به شرح زیر خواهد بود:

(11)

 

ضریب پخش سیگنال، معیاری برای اندازه‌گیری پراکندگی داده‌ها از میانگین است. این می‌تواند برای فهمیدن تنوع کلی در یک مجموعه داده مهم باشد که می‌تواند به‌نوبه خود بر فرایند یادگیری تأثیر بگذارد. واگرایی بالاتر، نشان‌دهنده مجموعه داده‌ای با تنوع بیشتر است که می‌تواند به تعمیم بهتر مدل کمک کند.

 

3-3-3. ضریب فشردگی ویژگی

تابع ضریب فشردگی ویژگی، هنجار ماتریس کوواریانس انحرافات نمونه‌ها از میانگینشان را محاسبه می‌کند. این اطلاعات بینشی درباره ساختار داخلی و روابط میان ابعاد داده‌ها فراهم می‌آورد؛ رابطه آن برابر است با (Zheng et al., 2023):

(12)

 

که  ماتریس کوواریانس انحرافات نمونه‌ها به رابطه زیر است (Zheng et al., 2023):

(13)

 

و  نیز بیانگر «نرم فروبنیوس»[31] به رابطه زیر است (Zheng et al., 2023):

(14)

 

ضریب فشردگی ویژگی، کوواریانس یا همبستگی متقابل بین ابعاد مختلف داده‌ها را می‌سنجد. این امر به فهم همبستگی داخلی میان داده‌ها کمک می‌کند که می‌تواند در بهبود عملکرد مدل‌ها از طریق اطمینان از ضبط مؤثر ساختارهای زیرین داده‌ها، حیاتی است.

این سه تابع در قالب یک تابع زیان سفارشی به کار می‌روند که برای تنوع و کیفیت داده‌ها، به بهبود فرایند یادگیری کمک می‌کنند. ضرایب پخش سیگنال و فشردگی ویژگی به فهم بهتر گسترش داده‌ها و ساختار درونی آن‌ها کمک می‌کند، درحالی‌که ضریب تنظیم SNR به‌صورت پویا بر اساس کیفیت سیگنال تنظیم می‌شود. این اجزا در کنار هم اطمینان می‌دهند که مدل به شکلی متوازن یادگیری کند و هم دقت و هم توانایی تعمیم آن را افزایش می‌دهند.

 

3-3-4. تابع زیان تطبیقی

برای اعمال ضرایب پخش سیگنال و فشردگی در هر دسته کوچک در طول فرایند آموزش، برای تقویت اطلاعات متمایز، از متغیر تنظیمی زیر استفاده می‌شود:

(15)

 

که در آن  نشان دهنده ضریب تنظیم پیشینی است که به ویژگی‌ها و توزیع نمونه‌ها در هر دسته کوچک بستگی دارد.  و  به ترتیب ضرایب خطی و نمایی هستند که به‌صورت دستی تنظیم می‌شوند.

در نهایت تابع زیان تطبیقی، به شرح زیر خواهد بود:

(16)

 

که در آن  همان ضریب تطبیقی است که در نهایت به یک تابع زیان رایج و غیرسفارشی‌شده اضافه می‌شود تا بتوان به نتایج حاصله رسید.

هنگامی‌که نسبت نمونه‌های مثبت به منفی در یک دسته کوچک 1 به 2 است، رابطه بین ضریب تطبیقی، نسبت واگرایی  و دو ضریب  و  در شکل شماره 3 نشان داده شده است.  کنترل‌کننده تأثیر اطلاعات متمایز بر شیب‌ها است، درحالی‌که  آستانه اشباع اطلاعات متمایز را تعیین می‌کند. یک  خیلی بزرگ منجر به شیب بیش‌ازحد می‌شود، به‌طوری که شبکه را نمی‌توان به‌طور پایدار آموزش داد. یک  خیلی کوچک نیز باعث می‌شود که گرادیان به‌شدت کاهش یابد و در نتیجه بر سرعت آموزش مدل تأثیر بگذارد. هنگامی‌که  از عدد 7 تجاوز می‌کند، تغییرات آن به‌ندرت بر عامل تنظیم پیشینی تأثیر می‌گذارد.

تابع زیان تطبیقی، تابع زیان دسته‌بندی استاندارد را با شرایط اضافی ترکیب می‌کند که در آن تابع، پراکندگی داده‌ها، ساختار داخلی و کیفیت سیگنال را در نظر می‌گیرد. این به فرایند یادگیری متعادل‌تر و قوی‌تری منجر خواهد شد و دقت و توانایی تعمیم مدل را افزایش می‌دهد.

 

شکل 3: رابطه بین ضریب تطبیقی، نسبت واگرایی و ضرایب خطی و نمایی

 

 

  1. ارزیابی مدل پیشنهادی

برای طی فرایند آموزش مدل، در ابتدا لازم است تا مقادیر «هایپرپارامتر»[32] مشخص شوند که در جدول (3)، معلوم هستند.

جدول 3: مقادیر هایپرپارامترها در طول فرایند آموزش

نرخ یادگیری اولیه

01/0

اندازه دسته M

64

نرخ تنزل وزن[33]

0005/0

ضریب انحراف آستانه 𝜖

2

ضریب خطی

9/0

ضریب نمایی

6

 

پس از مقداردِهی‌های اولیه، مدل با مشخصات ذکر شده در حلقه مد نظر ابتدا به اصطلاح پیش‌خور می‌شود و سپس با محاسبه خروجی و مقدار زیان با استفاده از تابع زیان تطبیقی، از وزن‌های قابل یادگیری در شبکه، مشتق زنجیره‌ای گرفته و با توجه به روش بهینه‌ساز، تغییرات در وزن‌ها اعمال می‌گردد. هرچند که فرایند کلی پیچیده به نظر می‌رسد؛ اما این توابع با تغییر دادن تابع زیان، به راحتی در فرایند آموزش شبکه قابل اجرا است.

 

جدول4: الگوریتم فرایند آموزشی مدل با استفاده از تابع زیان تطبیقی

Input: training set .

Initialization: parameters , learning rate , batch size M, SNR threshold , linear and exponential coefficients , .

Training Loop:

1:        for each epoch:

2:            update the learning rate in Eq. (1-5);

3:         for each mini-batch of training data :

4:                compute  in Eq. (10);

5:                compute  in Eq. (14);

6:                perform forward-propagation through the model;

7:             compute  in Eq. (16-4);

8:                compute gradients;

9:                update model weights ;

Output: the trained deep learning model (M).

 

سخت‌افزار مورد استفاده برای آموزش و آزمایش این مدل متشکل از دستگاه‌های i7 2.9 GHz CPU، 32 GB RAM و NVIDIA GeForce RTX 3090 GPU هستند. در ادامه نتایج به‌دست‌آمده مورد بررسی قرار خواهند گرفت.

 

4-1. عملکرد دسته‌بندی مدولاسیون

همان‌طور که شکل (4)، نشان می‌دهد، ابتدا به ارائه منحنی‌های بهینه‌سازی برای مدل CNN با استفاده از تابع زیان تطبیقی و بدون استفاده از تابع زیان تطبیقی، که در حقیقت از تابع زیان استاندارد آنتروپی متقاطع استفاده شده است، پرداخته شده است. ملاحظه می‌شود که تابع زیان تطبیقی تأثیر زیادی بر سرعت همگرایی مدل دارد. علاوه بر این، مشاهده می‌شود که مدل به حالت پایدار همگرایی می‌یابد، با وجود اینکه مجموعه داده‌ها شامل سیگنال‌هایی با دامنه‌های متفاوت SNR هستند.

 

 

شکل4: منحنی‌های بهینه‌سازی مدل CNN با/بدون تابع زیان تطبیقی

برای دو مجموعه داده آموزش و اعتبارسنجی

در جدول (5)، تلفات AMC و دقت مدل در مراحل آموزش، اعتبارسنجی و تست گزارش شده است. مشاهده می‌شود که دقت دسته‌بندی با استفاده از تابع زیان تطبیقی در مدل پیشنهادی برابر با 83/70 درصد شده است که به میزان 12/2 درصد بیشتر از دقت دسته‌بندی در مدل CNN با استفاده از تابع زیان استاندارد 71/68 درصد است. همچنین شکاف دقت بین مجموعه‌های اعتبارسنجی و آزمایش نیز کاهش‌ یافته که به کاهش خطاهای تعمیم منجر می‌شود.

جدول5: مقایسه تلفات و دقت برای مجموعه داده‌های مختلف برای هر دو مدل

مدل

تلفات

دقت دسته‌بندی بر حسب درصد

مجموعه آموزشی

مجموعه اعتبارسنجی

مجموعه ارزیابی

مجموعه آموزشی

مجموعه اعتبارسنجی

مجموعه ارزیابی

CNN با تابع زیان تطبیقی (SQACNN)

4940/0

8387/0

8412/0

30/79

99/70

03/71

CNN بدون تابع زیان تطبیقی

6741/0

9049/0

9037/0

27/74

02/69

71/68

 

در شکل (5)، نیز دقت دسته‌بندی دو مدل CNN با تابع زیان تطبیقی (SQACNN) و CNN بدون تابع زیان تطبیقی (Standard CNN) در طول SNR های مختلف نمایش داده ‌شده‌اند. همان‌طور که مشخص است مدل SQACNN توانسته است تا موجب بهبود چشمگیری در دقت دسته‌بندی، به‌خصوص در محیط‌هایی با SNR های پایین شود. به‌طوری‌که در کمترین SNR ممکن برابر با (dB 20-)، بهبود 68/13 درصد شده است.

 

شکل 5:

مقایسه دقت دسته‌بندی برای هر دو مدل SQANN و Standard CNN در طول SNR های مختلف

 

با در نظر گرفتن چندین SNR مختلف (18، 0، 10- و 20-)، ماتریس درهم‌ریختگی مدل پیشنهادی را برای بررسی دقت دسته‌بندی طرح‌های مدولاسیون مختلف در شکل (6)، نشان می‌دهیم. در SNR برابر با dB 20-، این مدل در دسته‌بندی بسیاری از انواع مدولاسیون با خطا مواجه است. عملکرد آن در سطوح پایین SNR ضعیف است، که این امر دشواری‌های تشخیص انواع مدولاسیون در شرایط پراختلال را نشان می‌دهد؛ هرچند که در مدولاسیون AM-SSB توانسته به تشخیص بالای 50% برسد. مشخص است که مدل با استفاده از تابع زیان تطبیقی می‌تواند در برابر تأثیرات نویز در مقاومت کند. با افزایش SNR به dB10- عملکرد بهبود چشمگیری می‌یابد و دقت 25/20 درصد افزایش یافته است. هرچند همچنان سردرگمی بین انواع مدولاسیون مشابه مشاهده می‌شود؛ اما افزایش SNR به کاهش نویز کمک کرده و در نتیجه به دسته‌بندی دقیق‌تر منجر می‌شود. در SNR برابر با dB 0 دقت به‌طور قابل توجهی افزایش یافته و از 86% عبور کرده است و مدل عملکرد بسیار خوبی از خود نشان می‌دهد. اکثر انواع مدولاسیون به‌جز چند مورد دسته‌بندی اشتباه به‌درستی تشخیص داده می‌شوند. با افزایش SNR، دقت دسته‌بندی به‌تدریج به حدود 90% می‌رسد.

 

شکل 6: ماتریس درهم‌ریختگی مدل پیشنهادی SQANN

در SNR بالاتر، برخی از مدولاسیون‌ها مانند 16QAM و 64QAM، [34]WBFM و [35]AM-DSB هنوز به‌اشتباه دسته‌بندی می‌شوند. چراکه نقاط صورت فلکی 16QAM توسط 64QAM پوشانده می‌شود، تشخیص 64QAM که حاوی بیت‌های خاصی از 16QAM است، دشوار است. درباره دسته‌بندی WBFM و AM-DSB هم می‌توان گفت که سیگنال‌های صوتی آنالوگ که دوره‌های خاموشی دارند و تنها با زنگ‌های حامل هستند، شناسایی آن‌ها دشوار است. البته تعداد کم نقاط نمونه‌برداری (128 نقطه) سیگنال‌های دریافتی منجر به از دست رفتن اطلاعات شده و ایجاد رابطه بین سیگنال و طرح مدولاسیون را برای مدل چالش‌برانگیز کرده است.

 

4-2. مقایسه با دیگر روش‌های پیشرفته AMC

برای اثبات برتری مدل پیشنهادی، جدول (6)، مقایسه‌ای با دیگر روش‌های پیشرفته در مجموعه داده RadioML2016.10a ارائه می‌کند. این مقایسه شامل روش‌های زیر می‌شود CNN–LSTM+priori regularization (Zheng et al., 2023)، SCNN (Zeng et al., 2019)، LSTM ساده[36] (Sang & Li, 2018)، LSTM ترکیبی[37] (Wu et al., 2018)، LSTM-IQFOC (Zhang & Sabuncu, 2018b)، CM-CNN (Yashashwi et al., 2018)، SVM (Yang et al., 2016)، همچنین DNN (Xie et al., 2019)، که از «ویژگی‌های تجمعی مرتبه بالا»[38] استفاده می‌کنند. بر اساس منحنی دقت دسته‌بندی مدل که در مقاله‌های اصلی تحت SNR های مختلف ارائه شده است، دقت دسته‌بندی برآورد شده روش‌های مقایسه‌ای در این جدول خلاصه گردیده است.

نتایج مقایسه نشان می‌دهد که مدل پیشنهادی دقت بالایی در دسته‌بندی در اغلب SNRها به‌خصوص در شرایط SNR پایین را دارا است که این نشان‌دهنده استحکام آن در محیط‌های پُراختلال است. با افزایش SNR، عملکرد همه مدل‌ها بهبود می‌یابد؛ اما SQACNN به‌طور مداوم دقت بالاتری را حفظ می‌کند؛ این نشان می‌دهد که SQACNN می‌تواند به‌طور مؤثر از اطلاعات اضافی سیگنال، موجود در SNR های بالاتر استفاده کند.

 

جدول6: مقایسه دقت دسته‌بندی مدولاسیون در روش‌های مختلف

روش‌های AMC

دقت دسته‌بندی در طول SNR های مختلف بر حسب درصد

20-dB

16- dB

12- dB

8-dB

4- dB

0

dB

4

dB

8

dB

12  dB

16 dB

میانگین

SCNN

10~

10~

20~

36~

60~

80~

82~

92~

90~

88~

8/56

Naive LSTM

10~

10~

14~

36~

74~

87~

90~

91~

91~

90~

3/59

Hybrid LSTM

10~

10~

14~

30~

64~

80~

83~

82~

82~

82~

7/53

LSTM-IQFOC

12~

12~

20~

42~

71~

84~

85~

86~

86~

87~

6/58

CM-CNN

9~

10~

18~

38~

64~

86~

88~

89~

90~

88~

0/58

SVM

9~

10~

14~

32~

62~

78~

81~

83~

83~

82~

4/53

DNN-cumulant

10~

11~

15~

34~

65~

76~

82~

83~

86~

87~

0/55

CNN-LSTM+priori regularization

15~

16~

24~

47~

78~

89~

92~

93~

94~

94~

2/64

SQACNN

66/33

18/37

67/44

51/62

11/78

82/86

78/87

23/89

01/89

42/88

03/71

 

در میان آن‌ها، SQACNN که با استفاده از تابع زیان تطبیقی آموزش‌دیده، میانگین دقت را تقریباً 7 درصد افزایش داده و بالاترین میانگین دقت دسته‌بندی را با 03/71 درصد کسب کرده است. این نشان می‌دهد که به‌طور متوسط، SQACNN برترین عملکرد دسته‌بندی را در سطوح مختلف نویز ارائه می‌دهد. همچنین SQACNN برخلاف برخی از مدل‌های دیگر که نوسانات قابل توجهی در عملکرد نشان می‌دهند، بهبود عملکرد ثابتی را در تمام سطوح SNR نشان می‌دهد.

جدول به‌وضوح نشان می‌دهد که مدل SQACNN در مقایسه با سایر مدل‌های AMC، در طیف وسیعی از سطوح SNR عملکرد بهتری دارد. مقاومت آن در شرایط پایین SNR و عملکرد قوی در محیط‌های با SNR بالا، اثربخشی و اعتمادپذیری آن را برای دسته‌بندی مدولاسیون خودکار متمایز می‌کند. دقت متوسط بالاتر، برتری مدل SQACNN را تقویت کرده و آن را به گزینه‌ای مطلوب‌تر برای انجام وظایف AMC در شرایط مختلف سیگنال تبدیل می‌کند.

با وجود ترکیب مدل‌های متعددی مانند CM و CNN برای بهبود برازش داده‌ها، افزایش تعداد پارامترها همیشه به بهبود دقت دسته‌بندی منجر نمی‌شود. روش‌های مبتنی بر ترکیب استخراج ویژگی و دسته‌بندی‌کننده کمترین دقت دسته‌بندی را دارند، مثلاً 4/53 درصد (SVM) و 0/55 درصد (DNN). ویژگی‌های رایج به‌سادگی تحت تأثیر عواملی مثل محوشدگی چند مسیری و اثر سایه قرار می‌گیرند که توصیف دقیق الگوی مدولاسیون سیگنال‌های دریافتی را دشوار می‌کند. ویژگی‌های دستی معمولاً سقف عملکرد دسته‌بندی‌کننده را تعیین می‌کنند؛ درحالی‌که مدل‌های یادگیری عمیق با استفاده از تابع زیان تطبیقی می‌توانند اطلاعات سیگنال‌ها را به‌طور کامل استخراج کنند.

 

4-3. ارزیابی مدل با داده‌های نویز اضافه‌شده

فرض گرفته می‌شود که در دنیای واقعی، سیگنال‌ها به همراه یک رشته نویز دریافت می‌شوند. ازاین‌رو سعی می‌شود تا یک رشته نویز بر روی سیگنال‌های موجود در مجموعه داده تست اضافه شود تا بتوان عملکرد مدل آموزش دیده را بر روی این داده‌ها نیز امتحان شود.

برای این امر، یک سیگنال نویز با توان نویز ثابت AWGN با میانگین صفر و واریانس صفر و به طول 25% و 40% از سیگنال اصلی که 128 نمونه دارد، ایجاد می‌شود که به معنی ایجاد سیگنال‌های نویز به طول 25 و 50 نمونه است. در نهایت طول سیگنال نهایی به ترتیب 153 و 178 نمونه خواهد بود. این سیگنال‌های نویز در سه مکان ابتدا، انتها و به‌صورت تصادفی در بین سیگنال قرار داده می‌شوند. شکل (7)، یک سیگنال در فرمت IQ با مدولاسیون 16QAM و SNR برابر با dB 6 و به طول 128 نمونه و سیگنال نویز به طول 25 را که به‌طور تصادفی درون سیگنال جای داده شده است، نشان می‌دهد.

 

شکل 7: نمایش سیگنال با مدولاسیون 16QAM بدون و به همراه نویز اضافه شده

مدلی که آموزش داده شده است، برای داده‌های ورودی به اندازه (128 و 2) کار می‌کند. اما این سیگنال‌ها دارای طول‌های بزرگ‌تر از نیاز هستند. به این منظور باید تغییراتی در سیگنال‌های جدید انجام داده شود، به‌طوری‌که اندازه آن‌ها مورد قبول مدل شود. دو رویکرد را می‌توان دنبال کرد؛ رویکرد اول این است که طول سیگنال‌ها را تغییر داد تا به اندازه مدنظر برسند که می‌توان سیگنال‌ها برش داده شوند که برای این کار نیز از سیستم رأی‌گیری اکثریت استفاده می‌شود.

رأی‌گیری اکثریت یک روش ساده، اما قدرتمند است که در یادگیری جمعی، ترکیب تصمیمات یا تشخیص الگو برای اتخاذ یک تصمیم نهایی بر اساس اکثریت آرای فردی استفاده می‌شود.

در این روش سیگنال به همراه نویز اضافه شده که دارای طولی بزرگ‌تر از اندازه ورودی به مدل است، به سه سیگنال جداگانه تقسیم می‌شود. به این صورت که اگر سیگنال به همراه نویز 25 نمونه باشد، طول سیگنال 153 خواهد بود. از این سیگنال به طول 153، سه سیگنال اولی از ابتدا سیگنال و به طول 128، دومی از انتها سیگنال و به طول 128 و در نهایت سومی از وسط سیگنال و به طول 128 گرفته شده و این سیگنال‌ها به مدل داده می‌شوند تا مدل نوع مدولاسیون را پیش‌بینی کند. پس برای هر سیگنال به طول بیشتر از اندازه ورودی مدل سه پیش‌بینی به دست می‌آید. از این سه پیش‌بینی، هرکدام که در اکثریت قرار بگیرد، به‌عنوان پیش‌بینی نهایی سیگنال در نظر گرفته می‌شود و درصورتی‌که هر سه پیش‌بینی‌ها دارای آرای جداگانه بودند، هرکدام یک که درجه اطمینان بیش‌تری در نظر خود داشته باشد، به‌عنوان نظر نهایی در نظر گرفته می‌شود. در شکل (8)، ارزیابی مدل بر روی مجموعه داده‌های به همراه نویز با استفاده از روش رأی‌گیری اکثریت نمایش داده شده است.

مشاهده می‌شود که بیشترین تأثیر نویز هنگام اضافه شدن آن در وسط سیگنال اتفاق می‌افتد و معلوم است که طول بزرگ‌تر نویز باعث تأثیر بیشتر بر روی دقت می‌شود. روش رأی اکثریت بخش‌های متعددی از سیگنال را تحت تأثیر قرار می‌دهد و تأثیر نویز را بر هر بخش کاهش می‌دهد؛ هرچند که باز تأثیر این نویز اضافه شده بر روی نمودار مشخص است. همچنین روش رأی اکثریت در برابر نویز قوی‌تر و مقاوم‌تر است؛ زیرا پیش‌بینی‌های چند بخش را ترکیب می‌کند. حتی اگر یک بخش دارای نویز باشد، بخش‌های دیگر می‌توانند به تصحیح پیش‌بینی نهایی کمک کنند و حتی اگر هر سه پیش‌بینی متفاوت باشند، پیش‌بینی با بالاترین اطمینان انتخاب می‌شود و لایه‌ای از قابلیت اطمینان به این روش اضافه می‌شود.

 

شکل 8:

ارزیابی مدل بر روی مجموعه داده‌های به همراه نویز با استفاده از روش رأی‌گیری اکثریت

 

 

نتیجه‌گیری و پیشنهاد

این تحقیق باهدف بررسی ارتقای روش‌های مورد استفاده در دسته‌بندی مدولاسیون خودکار انجام شده است. در این مطالعه، کاربرد یک مدل ترکیبی CNN برای دسته‌بندی سیگنال در شبکه‌های رادیویی شناختی بررسی شد. تمرکز اولیه بر بهبود دقت دسته‌بندی تحت شرایط مختلف SNR بوده است. یافته‌های این تحقیق را به شرح زیر می‌توان خلاصه کرد:

  • عملکرد مدل: مدل ترکیبی CNN که دارای یک تابع تلفات تطبیقی است، بهبود قابل ‌توجهی را در دقت دسته‌بندی در سطوح مختلف SNR در مقایسه با مدل‌های رایج نشان داد. به‌طور خاص، متوسط دقت دسته‌بندی به‌دست‌آمده 96/70 درصد بود که نسبت به مدل‌های دیگر افزایش قابل ‌توجهی است.
  • تابع زیان تطبیقی: معرفی تابع زیان تطبیقی به نرخ همگرایی سریع‌تر و افزایش استحکام مدل کمک کرد. این رویکرد به مدل اجازه داد تا به‌صورت پویا پارامترهای یادگیری خود را بر اساس سطوح SNR تنظیم کند و در نتیجه عملکرد را تحت شرایط نویز متفاوت بهینه کند و مدل را قادر سازد تا عملکرد بالا را حتی در شرایط نویز چالش‌برانگیز حفظ کند و استحکام و قابلیت اطمینان آن را به نمایش بگذارد.
  • پیشرفت‌های روش‌شناختی: این مطالعه همچنین اهمیت پیشرفت‌های روش‌شناختی مانند انتخاب فراپارامترهای مناسب و ادغام روش‌های آموزشی پیشرفته را برجسته کرد؛ این بهبودها نقش مهمی در دستیابی به دستاوردهای عملکرد گزارش شده دارد.
  • تجزیه‌وتحلیل مقایسه‌ای: از طریق ارزیابی مدل، مشاهده شد که مدل ترکیبی CNN از سایر مدل‌ها، به‌ویژه در سناریوهای SNR پایین، بهتر عمل می‌کند. این نشان‌دهنده توانایی مدل در مدیریت مؤثر تخریب سیگنال و حفظ دقت بالای دسته‌بندی است.
  • بررسی روش رأی اکثریت که با استفاده از بخش‌های مختلف سیگنال و ترکیب پیش‌بینی‌های آن‌ها، دقت و استحکام بالاتری برای نویز ارائه می‌دهد.

یافته‌های این مطالعه به‌طور چشمگیری به حوزه پردازش سیگنال و به‌خصوص در زمینه AMC کمک می‌کند. ادغام الگوریتم‌های یادگیری ماشین نشان داد که نه‌تنها دقت دسته‌بندی را افزایش می‌دهد، بلکه یک راه‌حل مقیاس‌پذیر برای تجزیه‌وتحلیل سیگنال‌های سریع فراهم می‌آورد. کاربردهای عملی این تحقیق شامل ارتباطات امنیتی پیشرفته و مدیریت طیف کارآمدتر است.

 

پیشنهادهای پژوهش

مواردی که برای تحقیقات آتی می‌توان بیان نمود؛ به شرح زیر هستند:

  • اصلاح و توسعه تابع زیان تطبیقی و دیگر تابع‌های مرتبط با آن برای افزایش سرعت آموزش، بدون تأثیر منفی بر روی دقت؛
  • بررسی کاربرد تابع زیان تطبیقی در انواع دیگر معماری‌های شبکه عصبی؛
  • بررسی ادغام این رویکرد با سایر روش‌های پردازش سیگنال همانند افزایش داده‌ها جهت بهبود بیشتر در عملکرد؛
  • گسترش داده‌های مورد استفاده برای شامل کردن سایر مدولاسیون‌های رایج؛
  • تمرکز بر روی توسعه الگوریتم‌های کارآمدتری که به داده‌های کمتری نیاز دارند و دقت را حفظ می‌کنند.

 

 

[1]. Automatic Modulation Classification

[2]. Signal to Noise Ratio

[3]. Electronic Warfare

[4]. intelligence, surveillance and reconnaissance

[5]. Gardner

[6]. Support Vector Machines

[7]. K-Nearest Neighbors

[8]. Dobre

[9]. Deep Learning

[10]. Convolutional Neural Networks

[11]. Heterogeneous Deep Model Fusion

[12]. Long–Short Term Memory

[13]. Convolutional Long Short-Term Deep Neural and Residual Network

[14]. Residual Networks

[15]. Graph neural network

[16]. Cognitive Radio

[17]. Internet of Things

[18]. Additive White Gaussian Noise

[19]. Line Of Sight

[20]. GNU Radio

[21]. Selective Multipath Rician Fading

[22]. Sample Rate Offset

[23]. Center Frequency Offset

[24]. Cross-Entropy

[25]. Signal Quality-Adaptive Convolutional Neural Network

[26]. Dropout

[27]. Shuffle

[28]. Signal Spreading Factor

[29]. Feature Compression Factor

[30]. SNR-Adjustment Factor

[31]. Frobenius Norm

[32]. Hyperparameter

[33]. Weight Decay Rate

[34]. Wide Band Frequency Modulation

[35]. Amplitude Modulation Double Side Band

[36]. Naive LSTM

[37]. Hybrid LSTM

[38]. High-Order Cumulant Feature

  • References

    • Ding, H., Fang, Y., Huang, X., Pan, M., Li, P., & Glisic, S. (2017). Cognitive Capacity Harvesting Networks: Architectural Evolution Toward Future Cognitive Radio Networks. IEEE Communications Surveys & Tutorials, PP, 1-1. https://doi.org/10.1109/COMST.20
    • Dobre, O. A., Abdi, A., Bar-Ness, Y., & Su, W. (2007). Survey of automatic modulation classification techniques: classical approaches and new trends. IET Communications, 1(2), 137-156. https://digital-library.theiet.org/content/journals/10.1049/iet-com_20050176
    • Gardner, W. (1994). An Introduction to Cyclostationary Signals. Cyclostationarity in Communications and Signal Processing.
    • Huang, L., Pan, W., Zhang, Y., Qian, L., Gao, N., & Wu, Y. (2020). Data Augmentation for Deep Learning-Based Radio Modulation Classification. IEEE Access, 8, 1498-1506. https://doi.org/10.1109/ACCESS.2019.2960775
    • Ian Goodfellow, Y. B. a. A. C. (2016). Deep Learning. MIT Press. http://www.deeplearningbook.org
    • Ioffe, S., & Szegedy, C. (2015). Batch normalization: Accelerating deep network training by reducing internal covariate shift. International conference on machine learning,
    • Lu, M., Peng, T., Yue, G., Ma, B., & Liao, X. (2021). Dual-channel hybrid neural network for modulation recognition. IEEE Access, 9, 76260-76269.
    • O’Shea, T. J., Corgan, J., & Clancy, T. C. (2016, 2016//). Convolutional Radio Modulation Recognition Networks. Engineering Applications of Neural Networks, Cham.
    • Pham, Q.-V., Nguyen, N. T., Huynh-The, T., Bao Le, L., Lee, K., & Hwang, W.-J. (2021). Intelligent Radio Signal Processing: A Survey. IEEE Access, 9, 83818-83850. https://doi.org/10.1109/access.2021.3087136
    • Sang, Y., & Li, L. A. (2018). Application of novel architectures for Modulation Recognition. 2018 IEEE Asia Pacific Conference on Circuits and Systems (APCCAS), 159-162.
    • Shea, T. J., & West, N. (2016). Radio Machine Learning Dataset Generation with GNU Radio. Proceedings of the GNU Radio Conference, 1(1). https://pubs.gnuradio.org/index.php/grcon/article/view/11
    • Wang, D., Lin, , Zhang, X., Huang, Y., & Zhu, Y. (2023). Automatic Modulation Classification Based on CNN-Transformer Graph Neural Network. Sensors, 23(16), 7281. https://www.mdpi.com/1424-8220/23/16/7281
    • Wu, Y., Li, X., & Fang, J. (2018). A Deep Learning Approach for Modulation Recognition via Exploiting Temporal Correlations. https://doi.org/10.1109/SPAWC.2018.8445938
    • Xie, G., Hu, S., Yu, C., Zhu, P., Peng, X., & Ouyang, J. (2019). Deep Learning in Digital Modulation Recognition Using High Order Cumulants. IEEE Access, PP, 1-1. https://doi.org/10.1109/ACCESS.2019.2916833
    • Yang, F., Li, Z., Zeng, S., Hao, B., Qi, P., & Pang, Z. (2016). A Novel Method for Wireless Communication Signal Modulation Recognition in Smart Grid. J. Commun., 11(9), 813-818.
    • Yashashwi, K., Sethi, A., & Chaporkar, P. (2018). A Learnable Distortion Correction Module for Modulation Recognition. IEEE Wireless Communications Letters, 8. https://doi.org/10.1109/LWC.2018.2855749
    • Zeng, Y., Zhang, M., Han, F., Gong, Y., & Zhang, J. (2019). Spectrum Analysis and Convolutional Neural Network for Automatic Modulation Recognition. IEEE Wireless Communications Letters, 8, 929-932.
    • Zhang, Z., & Sabuncu, M. (2018a). Generalized cross entropy loss for training deep neural networks with noisy labels. Advances in neural information processing systems, 31.
    • Zhang, Z., & Sabuncu, M. (2018b). Generalized Cross Entropy Loss for Training Deep Neural Networks with Noisy Labels.
    • Zheng, Q., Tian, X., Yu, Z., Wang, H., Elhanashi, A., & Saponara, S. (2023). DL-PR: Generalized automatic modulation classification method based on deep learning with priori regularization. Engineering Applications of Artificial Intelligence, 122. https://doi.org/10.1016/j.engappai.2023.106082