شناسایی مزارع سیب زمینی برمبنای شاخص فنولوژی و الگوریتم ماشین بردار پشتیبان با استفاده از سامانه رایانش ابری Google Earth Engine (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
سابقه و هدف: سیب زمینی چهارمین محصول کشت شده در جهان است. با توجه به اهمیت استراتژیک این محصول در تأمین امنیت غذایی، تهیه نقشه های دقیق از سطوح زیرکشت آن اطلاعات ضروری برای تخمین و پیش بینی میزان عملکرد محصول در مقیاس های متفاوت را فراهم می کند. اگرچه تا کنون رویکردهای متفاوت سنجش از دور، مبتنی بر سنجنده های اپتیکی یا مایکروویو، به طور گسترده برای پایش مزارع گوناگون (شامل سطح زیرکشت محصولات، شرایط و پیش بینی عملکرد آنها) به کار رفته، با استفاده از داده های سنجش از دور و یادگیری ماشین کمتر برای شناسایی مزارع سیب زمینی اقدام شده است. در این راستا، پژوهش حاضر به شناسایی و نگاشت محصول سیب زمینی در قطب تولید آن در کشور پرداخته است و سعی در مهیا سازی اطلاعات دقیق سطوح زیرکشت این محصول، برای حوزه مدیریت کلان کشاورزی را دارد. مواد و روش ها: ازآنجاکه بیشتر محصولات کشاورزی، در طول دوره کشت، ویژگی های طیفی زمانی منحصربه فردی دارند، این پژوهش با استفاده از تصاویر سری زمانی و بدون آستانه گذاری صریح، روشی را برای تمایز دادن مزارع سیب زمینی از سایر محصولات مطرح کرده است. طبق این روش، با استفاده از لایه های مبتنی بر فنولوژی محصول سیب زمینی و نیز یادگیری ماشین، به شناسایی این محصول روی آورده شد. به منظور بهینه سازی پارامترهای داخلی الگوریتم، براساس داده های زمینی نوع محصول در سایت مورد مطالعه که مجموعاً شامل 1648 نمونه از مزارع سیب زمینی و سایر محصولات می شود، آموزش و ارزیابی مدل انجام شد. این داده ها با استفاده از گیرنده GPS دستی نمونه برداری شد. در این پژوهش، نگاشت مزارع سیب زمینی با استفاده از تصاویر ماهواره سنتینل 2 و الگوریتم ماشین بردار پشتیبان انجام شد. با تهیه لایه های ورودی مناسب که شامل شاخص فنولوژیکی محصول سیب زمینی و شاخص آماری میانه NDVI (سری زمانی تصاویر ماهواره سنتینل 2) در بازه های مشخص می شود، مزارع سیب زمینی با دقت شناسایی شد. دراِدامه، این لایه ها به منزله ورودی های ماشین بردار پشتیبان به کار رفت. به منظور آموزش مدل بهینه برای ماشین بردار پشتیبان با استفاده از کرنل RBF، مقادیر gamma و C با روش 5-fold cross validation بهینه سازی شد. سپس این مقادیر، در فرایند اجرای الگوریتم، با استفاده از سامانه رایانش ابری گوگل ارث انجین به کار رفت. کارآیی روش پیشنهادی در شهرستان های همدان و بهار که بیشترین میزان کشت این محصول را در ایران دارند، ارزیابی شد. نتایج و بحث: براساس نتایج، مقادیر بهینه برای پارامترهای داخلی مدل C=70 و γ=0.3 محاسبه شد. این مقادیر در تابع RBF، به منظور شناسایی سطوح زیرکشت محصول سیب زمینی، در نظر گرفته شد. با اجرای الگوریتم طبقه بندی و سپس اعمال فیلتر Majority، نقشه سطوح زیرکشت سیب زمینی برای منطقه مورد مطالعه تهیه شد. این نقشه بیشترین تراکم کشت محصول سیب زمینی را در محدوده مرزی دو شهرستان (شمال غرب شهرستان همدان و شرق شهرستان بهار) نشان داد. سطح زیرکشت سیب زمینی برای سال زراعی 1399-1400، در شهرستان همدان، برابر 1/4527 هکتار و در شهرستان بهار، برابر 3/6088 هکتار به دست آمد. در ارزیابی نتایج، صحت کلی و ضریب کاپا به ترتیب برای همدان، 9/90% و 82/0 و برای بهار، 3/93% و 87/0 براساس ماتریس خطا برآورد شد. نتایج پژوهش حاضر به کارآیی الگوریتم ماشین بردار پشتیبان در شناسایی سطوح زیرکشت محصول سیب زمینی اشاره دارد و همچنین نشان داده است که شاخص های منطبق بر فنولوژی سیب زمینی را می توان، به منزله ویژگی های متمایزکننده در شناسایی بهتر مزارع این محصول، استفاده کرد. نتیجه گیری: شناسایی مزارع سیب زمینی، با استفاده از لایه های ورودی شاخص های منطبق بر فنولوژی محصول در الگوریتم ماشین بردار پشتیبان، نشان داد این روش می تواند صحت شناسایی سطوح زیرکشت این محصول را در سطح پایلوت بهبود ببخشد. ازاین رو می توان، برای شناسایی سایر محصولات مهم کشاورزی و نیز در دیگر مناطق، رویکردی مشابه را پیش گرفت و نتایج را ارزیابی کرد. همچنین پیشنهاد می شود کارآیی داده های مایکروویو و سایر الگوریتم های یادگیری ماشین در پژوهش های آینده مورد توجه قرار گیرد.Potato Fields Mapping Based on the Phenology Feature and Support Vector Machine Utilizing Google Earth Engine Platform
Introduction: Potato is the fourth most cultivated crop worldwide. In terms of its strategic role in food security, accurate potato mapping provides essential information for national crop censuses and potato yield estimation and prediction at any scale. Although remote sensing (RS) approaches based on optical and/or microwave sensors have been widely employed to monitor cultivated lands (including crop area, conditions, and yield forecasting), the identification of potato planting areas using RS data and machine learning has not been much addressed. As a result, the present research addresses the literature gap by suggesting an effective potato mapping approach in Iran's main production center and tries to provide accurate information on the cultivated areas of this crop for the field of agricultural management.
Material and Methods: Since most crops have specific spectral and temporal characteristics during their cultivation period, this research has presented a method to discriminate potato fields from other crops using time series images without explicit thresholding. Is. This method identified this product by using layers based on potato phenology and machine learning. We employed the ground truth data of the crop types from the studied site, which included a total of 1648 samples of potato fields and other crops, to optimize the internal parameters of the algorithm, train, and evaluate the model. A handheld GPS receiver was used to collect this data. This research employed Sentinel-2 satellite images and the Support Vector Machine (SVM) algorithm to map potato fields. To accurately identify potato fields, we prepared appropriate input layers, including the phenological index of the potato crop and the median statistical index of NDVI (time series of Sentinel-2 satellite images) at specific intervals. We used these layers as inputs to the SVM. We optimized the gamma and C values using the 5-fold cross-validation method to train the optimal model for SVM using the RBF kernel. We then used these values in the algorithm implementation process under the Google Earth Engine cloud computing platform. We assessed the efficacy of the suggested approach in the Iranian cities of Hamedan and Bahar, key sites for the cultivation of this particular crop.
Results and Discussion: Based on the results, the optimal values for the internal parameters of the model (C = 70 and γ = 0.3) were calculated. We included these values in the RBF function to identify the cultivated areas of the potato crop. By implementing the classification algorithm and then applying the majority filter, a map of the areas under potato cultivation was prepared for the study area. This map showed the highest density of potato cultivation in the border area of two cities (northwest of Hamedan city and east of Bahar city). The calculated total area for potato farming was 4527.1 hectares in Hamedan city and 6088.3 hectares in Bahar city. The estimated overall accuracy and Kappa coefficient are 90.9% and 0.82 for Hamedan and 93.3% and 0.87 for Bahar, respectively. The present research's results demonstrate the effectiveness of the SVM algorithm in detecting potato cultivation areas, highlighting the potential of using indicators corresponding to potato phenology as distinguishing features for improved identification.
Conclusion: By employing the SVM method, we effectively identified potato fields by utilizing layers of indicators that correspond to crop phenology. At the trial stage, it was demonstrated that this method can improve the potato acreage mapping process. Therefore, a similar approach can be evaluated for identifying other important crops in other regions. It is also suggested that the efficiency of microwave data and other machine learning algorithms be considered in future research.