TG Telegram Group & Channel
چالش پایتون | United States America (US)
Create: Update:

#متن_کاوی_با_پایتون

❇️ حالا بیاییم مثال قبل رو ادامه بدهیم جایی که کلمات با @ شروع میشدند. برای عبارتهای منظم ما یک کتابخانه re داریم که باید ابتدا ایمپورتش کنیم.
در واقع این کتابخانه برای عبارتهای منظم هست و دو حرف اول Regular Expressions هست.
برای این مورد خاص از متد search برای پیدا کردن عبارت منظمی که گفتیم استفاده میکنیم.

>>> import re
>>> [w for w in text13 if re.search('@[A-Za-z0-9_]+', w)]
['@UN', '@UN_Women']


الان در نتیجه مشاهده میکنیم که @ اول که بعدش یک فاصله بود در خروجی چاپ نخواهد کرد. و تمام الگوهای مورد نظر ما فقط در خروجی نمایش داده شد.

یکبار دیگه عبارت منظمی که استفاده کردیم رو تجزیه و تحلیل میکنیم:
@[A-Za-z0-9_]+

این عبارت منظم از سه بخش تشکیل شده است.

1- بخش اول علامت @ است و به قید و شرط باید استفاده گردد.
2- بخش دوم حروف بزرگ A-Z و حروف کوچک a-z و اعداد بین صفر تا نه خواهد بود . دقت کنید همه اعدادهای چند رقمی هم از این 10 عدد صفر تا نه تشکیل شده اند. همچنین آندرلاین (_) هم میتواند قرار داشته باشد. این بخش داخل یک کروشه قرار خواهد گرفت.
3- بخش سوم علامت + است که بعد از کروشه خواهد آمد. این علامت نشان دهنده این است که عبارتهای داخل کروشه میتوانند تکرار گردند.یعنی شما میتوانید یک عدد را بارها تکرار کنید یا حروف الفبای بزرگ و کوچک را تکرار نمایید.که به این علامت متاکارکتر در عبارتهای منظم گویند که در بخش بعد توضیحات بیشتری ارائه خواهیم کرد.

🗂 مرکز آموزش پایتون

🆔 : @pythonchallenge

چالش پایتون
#متن_کاوی_با_پایتون ❇️ پیدا کردن الگوهای با عبارتهای منظم اینکه بگوییم چیزی با @ شروع میگردد یک الگو می باشد برای ما کافی نیست. بلکه نشانه های است که با @ شروع می شوند و چیزی رو باید دنبال کنند. برای مثال چگونه میتوانیم تشخیص دهیم که اگر @ در جمله ای ذکر…
#متن_کاوی_با_پایتون

❇️ حالا بیاییم مثال قبل رو ادامه بدهیم جایی که کلمات با @ شروع میشدند. برای عبارتهای منظم ما یک کتابخانه re داریم که باید ابتدا ایمپورتش کنیم.
در واقع این کتابخانه برای عبارتهای منظم هست و دو حرف اول Regular Expressions هست.
برای این مورد خاص از متد search برای پیدا کردن عبارت منظمی که گفتیم استفاده میکنیم.

>>> import re
>>> [w for w in text13 if re.search('@[A-Za-z0-9_]+', w)]
['@UN', '@UN_Women']


الان در نتیجه مشاهده میکنیم که @ اول که بعدش یک فاصله بود در خروجی چاپ نخواهد کرد. و تمام الگوهای مورد نظر ما فقط در خروجی نمایش داده شد.

یکبار دیگه عبارت منظمی که استفاده کردیم رو تجزیه و تحلیل میکنیم:
@[A-Za-z0-9_]+

این عبارت منظم از سه بخش تشکیل شده است.

1- بخش اول علامت @ است و به قید و شرط باید استفاده گردد.
2- بخش دوم حروف بزرگ A-Z و حروف کوچک a-z و اعداد بین صفر تا نه خواهد بود . دقت کنید همه اعدادهای چند رقمی هم از این 10 عدد صفر تا نه تشکیل شده اند. همچنین آندرلاین (_) هم میتواند قرار داشته باشد. این بخش داخل یک کروشه قرار خواهد گرفت.
3- بخش سوم علامت + است که بعد از کروشه خواهد آمد. این علامت نشان دهنده این است که عبارتهای داخل کروشه میتوانند تکرار گردند.یعنی شما میتوانید یک عدد را بارها تکرار کنید یا حروف الفبای بزرگ و کوچک را تکرار نمایید.که به این علامت متاکارکتر در عبارتهای منظم گویند که در بخش بعد توضیحات بیشتری ارائه خواهیم کرد.

🗂 مرکز آموزش پایتون

🆔 : @pythonchallenge


>>Click here to continue<<

چالش پایتون




Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)