Експерт за Semalt: Како да се извлече текст од веб-страници

Додека постојат алатки за стружење што можат да извлечат податоци од повеќе страници за неколку секунди, единствениот сигурен начин за извлекување текст од веб-страници секогаш го истакнуваше и копира текстот. Но, овој метод е малку незгоден, особено во случаи кога треба да копирате текст од повеќе страници. Исто така, веб-развивачите доаѓаат со средства за заклучување на содржината на веб-страницата за да спречат „копирање“ на истата.

Сега да започнам, постојат различни брзи методи за извлекување текст од веб-страници. Во зависност од количината на текст што сакате да го добиете, можете да изберете помеѓу следниве режими:

1. Метод на зачувување на страница

Оваа техника се потпира на можноста на прелистувачите да зачуваат локално копија на тековната веб-страница. За да го сторите тоа, едноставно држете ги копчињата + S контроли заедно или можете да кликнете со десното копче на страницата и одберете ја страницата од менито што се појавува. Ова ќе започне со прозорецот за истражувачи што бара од вас да наведете некои атрибути на веб-страницата.

На долниот дел, постои опција "име на датотека" што ќе ви даде можност да го наведете името на датотеката со веб-страници. Важно е да се напомене дека прелистувачот исто така ќе создаде папка со слично име што ќе ги содржи сите приложени податоци од веб-страницата, како што се слики и заднини.

Под тоа, постои опција "зачувај како тип" што ви овозможува да одредите кој тип на датотека сакате да се зачувате како. Имајќи предвид дека ние сме заинтересирани за текст само изберете „Зачувај“ како „.txt“ што автоматски ќе креира текстуална датотека што ги содржи сите текстови на веб-страницата и може да се уредува со користење на кој било процесор за зборови. Овој метод е особено корисен во сценарија каде што треба да копирате цели страници. Во случај да треба да изоставите некои делови од текстот, едноставно отворете ја текстуалната датотека и отсечете го непотребниот текст.

2. Метод на Ctrl + C и Ctrl + V

Ова е веројатно најстариот трик во книгата, само со помош на глувчето за да го потенцирате текстот што сакате да го извадите, тогаш можете да продолжите да го копирате и залепите на друго место. Овој метод е корисен кога треба да копирате делови и брзо да ги користите во друг документ.

За да го извршите ова, треба да дојдете до делот што го содржи текстот што ви треба, притиснете и задржете го левото копче на глувчето за да го префрлите курсорот од режимот „навигација“ во режимот „нагласи“. Ова ќе ви овозможи да го потенцирате текстот, да го сторите тоа, држете го левото копче на глувчето и движете го курсорот наоколу за да го потенцирате вашиот текст. Кога ќе завршите, ослободете го копчето и десен клик на текстот што сте го копирале за да се појави менито за навигација. На неа кликнува на опцијата "копирај" за да го копира избраниот текст.

Отидете до текстуалниот документ каде сакате да го зачувате текстот и десен клик за да се појави менито и кликнете на паста.

Важно е да се напомене дека можете да изберете помеѓу различни режими за залепување, но доколку сте заинтересирани само за текст, кликнете на паста како обичен текст.

mass gmail