عنوان: خوشه بندی تعمیم یافته و یادگیری چندگانه با حفظ ساختار هندسی
اگرچه خوشهبندی مبتنی بر چندگانه به یک موضوع تحقیقاتی محبوب تبدیل شده است، اما مشاهده میکنیم که یک عامل مهم توسط این آثار حذف شده است، یعنی از دست دادن خوشهبندی تعریفشده ممکن است ساختار محلی و جهانی فضای پنهان را خراب کند. در این مقاله، یک چارچوب جدید خوشهبندی تعمیمیافته و یادگیری چندگانه (GCML) با حفظ ساختار هندسی برای دادههای تعمیمیافته پیشنهاد میکنیم، یعنی محدود به دادههای تصویر دوبعدی نیست و دارای طیف گستردهای از کاربردها در گفتار، متن، و حوزه های زیست شناسی در چارچوب پیشنهادی، خوشهبندی منیفولد در فضای پنهان انجام میشود که توسط یک از دست دادن خوشهبندی هدایت میشود. برای غلبه بر این مشکل که از دست دادن خوشهمحور ممکن است ساختار هندسی فضای پنهان را بدتر کند، یک افت ایزومتریک برای حفظ ساختار درون چندگانه به صورت محلی و یک افت رتبهبندی برای ساختار بین چندگانه در سطح جهانی پیشنهاد شدهاست. نتایج تجربی گسترده نشان داده است که GCML از نظر تجسمهای کیفی و معیارهای کمی عملکرد برتری نسبت به همتایان خود نشان میدهد، که اثربخشی حفظ ساختار هندسی را نشان میدهد.
خوشه بندی تعمیم یافته و یادگیری چندگانه (GCML)
کد شامل ماژول های زیر است:
مجموعه داده ها (MNIST-full، MNIST-test، USPS، Fashion-MNIST، Reuters-10k، HAR، و Pendigits)
آموزش GCML
معیارهای ارزیابی
تجسم
الزامات
pytorch == 1.3.1
scipy == 1.3.1
numpy == 1.18.5
scikit-learn == 0.21.3
matplotlib == 3.1.1
شرح
main.py
pretrain() — پیش آموزش مدل با اتلاف خود بازسازی
train() — آموزش سرتاسر مدل GCML
test() — تست عملکرد تعمیم در خارج از نمونه (نمونه آزمایشی)
autotrain.py — اسکریپت هایی برای آزمایش خودکار روی هفت مجموعه داده
database.py
Dataset() – بارگذاری داده های مجموعه داده انتخاب شده
evaluation.py
GetIndicator() – ابزار کمکی برای ارزیابی متریک
loss.py
Loss_calculate() — محاسبه تلفات: ℒLIS، ℒrank، ℒAE، ℒalign
model.py
AutoEncoder() — معماری استفاده شده در این کار
GCML() — محاسبه توزیع Q و توزیع P
utils.py
visualize() – ابزارهای کمکی برای تجسم نتایج میانی
Clustering() — برای مقداردهی اولیه مراکز خوشه بندی
مجموعه داده
مجموعه داده های مورد استفاده در این مقاله در لینک دانلود این پروژه موجود است.
اجرای کد
بسته های وابستگی مورد نیاز را نصب کنید
برای دریافت نتایج روی هفت مجموعه داده، اجرا کنید
python autotrain.py
برای دریافت معیارها و تجسم، به
../plots/dataset/pics/
اشاره می شود
که در آن مجموعه داده یکی از هفت مجموعه داده است (MNIST-full، MNIST-test، USPS، Fashion-MNIST، Reuters-10k، HAR، و Pendigits)
پروژه مشابه دارید؟
برای ثبت سفارش در سیمیا می توانید از طریق اپلیکیشن سیمیا، یا فرم ثبت سفارش در سایت اقدام کرده و یا از طریق ایمیل، واتساپ، تلگرام و اینستاگرام اقدام نمایید.
اپلیکیشن سیمیا را از بازار و مایکت دانلود کنید.
سریع ترین راه پاسخگویی سیمیا، واتساپ می باشد. لینک واتساپ، اینستاگرام و تلگرام در پایین سایت وجود دارد.
نشانی ایمیل سیمیا simiya_ht@yahoo.com می باشد.
از برقراری تماس برای هماهنگی پروژه خودداری کنید، حجم بالای سفارشات به ما اجازه نمی دهد تا از طریق تلفن پاسخگوی شما عزیزان باشیم، حتما درخواست خود را به صورت مکتوب و از طریق یکی از راه های ذکر شده فوق ارسال نمایید، درخواست خود را به طور کامل و با تمام فایل ها و توضیحات لازم ارسال نمایید تا مدت زمان بررسی آن به حداقل برسد. پس از تعیین کارشناس، در اسرع وقت به شما پاسخ می دهیم.
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.