کتاب داده کاوی و یادگیری ماشین (1)
آزمون تاپ
نویسنده: محمد ذکی، واگنر مایرا
مترجمین: محمدتقی بطحایی، حسن گلزاریکلور
سال چاپ : 1402
نوبت چاپ: 1
360,000 تومان
کتاب داده کاوی و یادگیری ماشین (1)
(جلد اول: آمار مقدماتی و داده کاوی)
پیشگفتار مترجمان کتاب
بخش اعظم تمدن و فرهنگ امروز جهان مدیون زحمات علمی دانشمندان بزرگ است که در پرتو نبوغ و اندیشه آنها مطالب علمی و فنی مورد بحث و تحقیق قرار گرفته و در هر یک از شاخههای علمی و فنی کتابهای جامع تدوین و مورد استفاده محققین و دانشمندان جوان قرار میگیرد.
اغلب کشورهای در حال توسعه در صدد جبران دور ماندن از این مسیر تکامل علمی بر آمدهاند و در اکتساب علوم جدید سعی وافی مبذول میدارند. برای رسیدن به این مطلوب، داشتن کتابهای مفید و اشاعه آن بین جوانان ضروری است. این افراد از شایستهترین خدمتگزاران کشور به شمار میآیند و باید مورد تقدیر قرار گیرند.
جناب پرفسور محمد زکی مولف و گرد آورنده محترم این کتاب که از جمله خدمتگذاران حقیقی این رشته است، موجب ترویج دانش هوش مصنوعی مبتنی بر استفاده از دادههای یک سیستم و تبدیل آن به اطلاعات مفید و سپس به دانش و بالاخره با خردورزی کاربردی کردن آن برای رفاه و آسایش جامعه جهانی شدهاند.
کتاب دادهکاوی وکاربرد آن در انواع آموزشهای عمیق هوش مصنوعی که از نظر خوانندگان میگذرد، موجب رواج انقلاب علمی در حوزههای مختلف دانش بشر و تاثیر در ارتقاء رفاه جامعه جهانی در یک نقشه راه عملیاتی ارائه شده است.
این کتاب در ردیف کتب پایه تخصصی تمام حوزههای هفتگانه علمی مانند معماری و هنر، فنی و مهندسی، کشاورزی، علوم انسانی، علوم پایه، پزشکی و محیط زیست میباشد که اصل آن به زبان لاتین نگاشته شده و اکنون به فارسی ترجمه شده است. لذا مطالعه این کتاب را برای محققین جوان که میخواهند با دانش نوین هوش مصنوعی آشنا شده و خود را برای توسعه علوم و فنون جهان امروز آماده سازند، بسیار مفید و اثر بخش است.
با آرزوی پیشرفت علمی در حوزههای مختلف در کشور عزیزمان، توفیق ارائه این خدمت علمی را وامدار خداوند متعال از صمیم قلب سپاسگزارم و همچنین توفیق مولف و مترجمین این کتاب را برای خدمت بزرگتر از خداوند متعال مسئلت مینمایم.
پیشگفتار مؤلفان کتاب
دادهکاوی و یادگیری ماشین فرد را قادر میسازد تا بینش و دانش اساسی را از دادهها به دست آورد. آنها امکان کشف الگوهای روشنگر، جالب و جدید و همچنین مدلهای توصیفی، قابل درک و پیشبین را از دادههای مقیاس بزرگ فراهم میکنند.
چندین کتاب خوب در این زمینه وجود دارد، اما بسیاری از آنها یا سطح بالایی دارند یا بسیار پیشرفته هستند. این کتاب یک متن مقدماتی است که پایههای مفاهیم و الگوریتمهای اساسی در یادگیری ماشین و داده کاوی را میگذارد. مفاهیم مهم در ابتدا با مراحل و جزئیات دقیق توضیح داده میشوند. هدف اصلی کتاب ایجاد شهود در پشت فرمولها از طریق تعامل هندسی، جبری و تفاسیر احتمالاتی از دادهها و روشها است.
ویرایش دوم بخش کاملا ًجدیدی را در مورد رگرسیون اضافه میکند، از جمله رگرسیون خطی و لجستیک، شبکههای عصبی و یادگیری عمیق. محتوا همچنین در چندین فصل دیگر به روز شده و خطاهای شناخته شده رفع شده است. بخشهای اصلی کتاب شامل مبانی تحلیل دادهها، الگوکاوی مکرر،خوشه بندی، طبقه بندی و رگرسیون است. این فصلها روشهای اصلی و همچنین موضوعات پیشرفته مانند یادگیری عمیق، روشهای هسته[1]، تجزیه و تحلیل دادههای با ابعاد بالا و تحلیل گراف را پوشش میدهند.
این کتاب شامل مثالهای زیادی برای نشان دادن مفاهیم و الگوریتمها است. همچنین دارای تمرینات پایان فصل است که در کلاس از آنها استفاده شده است. تمامی الگوریتمهای کتاب توسط نویسندگان پیاده سازی شده است. برای کمک به درک عملی، ما به خوانندگان پیشنهاد میکنیم که این الگوریتمها را به تنهایی پیاده سازی کنند (مثلا ًبا استفاده از Python یا R ). منابع تکمیلی مانند اسلایدها، مجموعه دادهها و ویدیوها به صورت آنلاین در سایت همراه کتاب در دسترس هستند:
http://dataminingbook.info
این کتاب را میتوان برای دورههای کارشناسی و کارشناسی ارشد در داده کاوی، یادگیری ماشین و علوم داده استفاده کرد. در ابتدای هر بخش از کتاب مروری کوتاه بر فصول ارائه شده است. فصلها عمدتا ًدارای محتوای جامع هستند (با معادلات مهم برجسته شده اند)، اما دورههای مقدماتی با پوشش مبانی اولیه تجزیه و تحلیل دادهها در بخش اول مفید خواهند بود. به عنوان مثال، فصل روشهای هسته در بخش اول باید قبل از سایر الگوریتمهای مبتنی بر هسته که در ادامه آورده میشوند پوشش داده شود. بخشهای مختلف را میتوان با ترتیب متفاوتی بر اساس اهمیت دوره یا علاقه خواننده پوشش داد. در نهایت، توصیه میکنیم در مورد اشتباهات یا پیشنهادات دیگر از طریق سایت همراه کتاب با ما تماس بگیرید.
فهرست کتاب داده کاوی و یادگیری ماشین (1)
بخش یک/ مبانی تحلیل دادهها 15
فصل اول / ماتریس دادهها 19
1-1 ماتریس دادهها 20
2-1 ویژگیها 22
1-3 دادهها: دیدگاه جبری و هندسی… 23
1-3-1 فاصله و زاویه. 25
1-3-2 میانگین و واریانس… 28
1-3-3 تصویر متعامد. 29
1-3-4 استقلال خطی و ابعاد 31
1-4 داده دیدگاه احتمالاتی… 33
1-4-1 متغیرهای تصادفی دو متغیره. 39
1-4-2 متغیرهای تصادفی چند متغیره. 43
1-4-3 نمونه تصادفی و آمار 44
1-5 مطالعه بیشتر. 46
1-6 تمرینات.. 46
فصل دوم / ویژگیهای عددی.. 47
1-2 تجزیه و تحلیل تک متغیره. 48
2-1-1 معیارهای گرایش مرکزی.. 49
2-1-2 معیارهای پراکندگی.. 54
2-2 تجزیه و تحلیل دو متغیره. 59
2-2-1 معیارهای مکان و پراکندگی.. 60
2-2-2 معیارهای پیوند. 61
2-3 تحلیل چند متغیره. 66
2-4 نرمال سازی دادهها 70
2-5 توزیع نرمال. 72
2-5-1 توزیع نرمال تک متغیره. 72
2-5-2 توزیع نرمال چند متغیره. 74
2-6 مطالعه بیشتر. 79
2-7 تمرین.. 79
فصل سوم / ویژگیهای رستهای.. 83
3-1 تجزیه و تحلیل تک متغیره. 84
1-1-3 متغیر برنولی.. 84
2-1-3 متغیر برنولی چند متغیره. 87
2-3 تجزیه و تحلیل دو متغیره. 93
3-2-1 وابستگی ویژگی: تجزیه و تحلیل رخداد احتمالی.. 100
3-3 تجزیه و تحلیل چند متغیره. 104
1-3-3 تجزیه و تحلیل رخداد احتمالی چند راهه. 106
3-4 فاصله و زاویه. 109
3-5 گسسته سازی.. 111
3-6 مطالعه بیشتر. 113
3-7 تمرین.. 113
فصل چهارم / گراف دادهها 117
4-1 مفاهیم گراف.. 118
4-2 ویژگیهای توپولوژیکی… 123
4-3 تجزیه و تحلیل مرکزیت.. 128
4-3-1 مرکزیتهای پایه. 128
4-3-2 مرکزیت وب.. 130
4-4 مدلهای گراف.. 140
4-4-1 مدل گراف تصادفی اردوش – رنیی.. 143
4-4-2 مدل گراف دنیای کوچک وات-استروگاتز 147
4-4-3 مدل بدون مقیاس بارباشی-آلبرت.. 153
4-5 مطالعه بیشتر. 161
4-6 تمرینات.. 162
فصل پنجم / روشهای هسته. 165
1-5 ماتریس هسته. 171
5-1-1 بازتولید نگاشت هسته. 172
2-1-5 نگاشت هسته مرسر 174
2-5 هستههای برداری.. 177
3-5 عملیات اصلی هسته در فضای ویژگی… 182
4-5 هسته برای اشیاء پیچیده. 188
1-4-5 هسته طیف برای رشتهها 188
2-4-5 هستههای انتشار در گرافهای گره. 189
5-5 مطالعه بیشتر. 194
6-5 تمرین.. 194
فصل ششم/ دادههای با ابعاد بالا. 197
6-1 اشیاء با ابعاد بالا. 198
2-6 حجمهای با ابعاد بالا. 201
6-3 ابر کره محاط در داخل ابر مکعب.. 204
4-6 حجم پوسته ابر کره نازک.. 205
6-5 قطرها در ابرفضا 207
6-6 چگالی نرمال چند متغیره. 208
6-7 ضمیمه : مشتق از حجم ابر کره. 211
8-6 مطالعه بیشتر. 216
9-6 تمرینات.. 216
فصل هفتم/ کاهش ابعاد. 219
1-7 سابقه. 220
2-7 تجزیه و تحلیل مولفههای اصلی… 224
1-2-7 بهترین تقریب خط. 225
7-2-2 بهترین تقریب دو بعدی.. 229
7-2-3 بهترین تقریب r بعدی.. 232
7-2-4 هندسه PCA. 236
7-3 تجزیه و تحلیل مولفه اصلی هسته. 239
7-4 تجزیه مقدار منفرد. 247
7-4-1 هندسه SVD. 248
2-4-7 ارتباط بین SVD و PCA. 250
7-5 مطالعه بیشتر. 251
7-6 تمرین.. 252
بخش دوم / کاوش الگوهای تکرار 255
فصل هشتم/ کاوش مجموعه اقلام. 257
1-8 مجموعه اقلام پر تکرار و قوانین انجمن.. 258
2-8 الگوریتمهای کاوش مجموعه اقلام. 262
1-2-8 رویکرد سطح عاقلانه : الگوریتم Apriori 265
2-2-8 رویکرد تقاطع مجموعه Tid: الگوریتم Eclat 268
3-2-8 رویکرد درخت الگوی پرتکرار : الگوریتم FPGrowth. 275
3-8 تولید قوانین انجمن.. 279
4-8 مطالعه بیشتر. 281
5-8 تمرین.. 282
فصل نهم/ خلاصه سازی مجموعه اقلام. 289
1-9 مجموعه اقلام مکرر حداکثر و بسته. 290
2-9 کاوش مجموعه اقلام مکرر : الگوریتم GENMAX. 294
3-9 کاوش مجموعه اقلام مکرر بسته : الگوریتم CHARM.. 297
4-9 مجموعه اقلام غیر قابل استخراج. 300
9-5 مطالعه و بیشتر. 305
6-9 تمرین.. 306
فصل دهم / کاوش توالی… 311
10-1 توالیهای مکرر 312
10-2 کاوش توالیهای مکرر 313
10-2-1 کاوش از نظر سطح : GSP. 314
10-2-2 کاوش توالی عمودی: Spade. 316
10-2-3 کاوش توالی مبتنی بر طرح : PrefixSpan. 318
10-3 کاوش زیر رشتهای از طریق درختان پسوند. 320
10-3-1 درخت پسوندی.. 321
2-3-10 الگوریتم زمان خطی Ukkonen. 324
10-4 مطالعه بیشتر. 331
10-5 تمرین.. 332
فصل یازدهم / کاوش الگوی گراف.. 337
1-11 یک ریختی و پشتیبانی… 338
11-2 تولید کاندید. 342
11-2-1 کد متعارف.. 344
11-3 الگوریتم GSPAN. 347
11-3-1 محاسبات توسعه و پشتیبانی.. 351
11-3-2 بررسی متعارف بودن. 355
11-4 مطالعه و بیشتر. 357
11-5 تمرین.. 357
فصل دوازدهم/ ارزیابی الگو و قوانین.. 361
12-1 معیارهای اریابی قوانین و الگو. 362
12-1-1 معیارهای ارزیابی قواعد. 362
12-1-2 معیارهای ارزیابی الگو 372
12-1-3 مقایسه قوانین و الگوهای متعدد 375
12-2 آزمون اهمیت و فواصل اطمینان. 379
12-2-1 آزمون دقیق فیشر برای قوانین تولید کننده. 379
12-2-2 آزمون جایگشت برای اهمیت.. 384
12-2-3 نمونه برداری بوت استرپ برای فاصله اطمینان. 390
12-3 مطالعه بیشتر. 392
12-4 تمرین.. 393
واژه نامه فارسی – انگلیسی… 396
مشخصات: کتاب داده کاوی و یادگیری ماشین (1)
|