سلام. احتمالا انجمن درستی رو برای سوالم انتخاب کردم.
چطوری میشه یه لینک رو از یه متن با grep یا sed استخراج کرد بطوریکه تنها همون url و نه تمام اون خط انتقال پیدا کنه؟
<td><a href="../pdf/117-144-C612-10.pdf" target=_blank><img border=0 src="../images/pdf.jpg"></a><a href="../pdf/117-144-C612-10.pdf" target=_blank><font face=tahoma size=2>sample</a></td>
<td dir=ltr align=center><font face=tahoma style="font-size:11px;"> (274 KB)</font>
</td>
من از این دستور برای جدا کردن این قسمت از سورس html استفاده کردم و نتیجه هم بالایی هست:
grep "../pdf" 1>2
لطفا طوری دستور رو بازسازی کنید که نتیجه بشه :
../pdf/117-144-C612-10.pdf