如何提取電影中的片段字幕
A. 什麼工具能提取電影中的字幕
字幕和字幕軟體vobsub及其簡單設置
介紹字幕和字幕軟體vobsub及其簡單設置。字幕最常見的是idx/sub(直接從DVD光碟上提取的字幕格式)和文本格式的srt,ssa/ass幾種格式。
vobsub目前的版本2.32,根據目前操作系統的情況,建議安裝2.23,2.29和2.32這3個版本。2.23比較穩定,適合各種操作系統,2.29以上的版本盡管功能更強大,但兼容性不是很好。Easy Realmedia Procer就內置了完整的2.23版本。建議使用這個軟體壓制rmvb,同時使用它內置的vobsub2.23版本
SRT和SSA兩種格式的字幕均為文本格式字幕,其共同的優點是:
* 只需要單獨一個文件即可使用,不象SUB字幕還需要一個idx定義文件
* 字幕文件很小,都在幾十KB以內,便於傳播以及刻碟 :-)
* 用任何文本編輯工具都能夠打開,非常便於對字幕內容進行細節修改和調整
* 使用者能夠隨心所欲定製觀看影片時字幕的字體、大小、顏色等等
* 都被VobSub直接支持
而在SRT和SSA兩者之間比較,SRT格式只有時間碼和文本,太過於簡單,很容易因設置等問題導致在看影片時產生亂碼,新手使用起來會感覺麻煩;而SSA格式可以在字幕內附帶作者信息、修訂信息、字幕參數等,更可以預先即定義好字幕播放時使用的字體、大小、風格等多種內容,兼有SRT字幕和SUB等圖形字幕的優點。所以,SSA字幕比SRT字幕應該更有優勢,個人在這里大力提倡使用SSA格式字幕。總之,對於稍有經驗的玩家,文本格式的字幕肯定是最好的選擇。
我們要學好SSA主要從兩個方面著手:一個是SSA文件的組成結構;一個是SSA代碼。
一.SSA文件的組成結構
SSA文件主要由三大部分組成:[Script Info]部分,[v4 Styles]部分和[Events]部分。
1.[Script Info]部分
PlayResX: 384
PlayResY: 288
384×288是標準的4:3畫面解析度之一。ssa字幕里的坐標(字幕的位置)即根據這2個數值的范圍來定義。16:9寬銀幕的片子略做調整即可。
這里主要介紹文件本身和製作者的信息,這裡面最重要的兩項是PlayResX和PlayResY,它實際上是按給定的PlayResX和PlayResY數值將屏幕按比例化分,屏幕的左上角坐標為(0,0),右下角坐標為(PlayResX數值,PlayResY數值).這兩個值最好是和視頻文件的長寬相同,這樣在下面[Events]部分文本位置坐標的設定很方便而且准確.
當然這兩個值也可能和原視頻文件的長寬不同,比如視頻文件尺寸為640x360,而PlayResX:384,PlayResY: 288,如同前面所說的,它是將屏幕長寬按384:288來化分的.一旦這樣劃定,下面的各種坐標設定都要以384和288為根據.
特別要注意的是:對於一個已經存在並且文本坐標都設置好的SSA文件,如果它的PlayResX和PlayResY數值和視頻文件的長寬尺寸不符(包括成比例的情況,比如視頻文件尺寸為640x360,而PlayResX:320,PlayResY: 180),我們不要簡單的把PlayResX和PlayResY數值改成屏幕尺寸,這樣將導致字幕失真,是因為文本部分的尺寸並沒有改,仍按照原來的PlayResX和PlayResY數值設定.如果有較多的坐標設定,就不要改原來的PlayResX和PlayResY數值,在原基礎上編輯.
2.[V4 Styles]部分
這是個存放[Events]部分里所用到的各種字體信息的地方.可以存在多種字體,每種字體有多種特徵.當[Events]部分的Name項引用到這里的某種字體時,則意味這該字體的各種特徵也被引用.字體的特徵還可以在文本行中修改,這將在[Events]部分討論.
常見的字體屬性有Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, TertiaryColour, BackColour, Bold, Italic, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, AlphaLevel, Encoding
我們可以再定義一個Style,並命名為mine,如Style: mine,華文新魏,18,&HFF0000,&HFF80FF0,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
即可以這樣:
[V4 Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, TertiaryColour, BackColour, Bold, Italic, BorderStyle,Outline, Shadow, Alignment, MarginL, MarginR, MarginV, AlphaLevel, Encoding
Style: Default,華文彩雲,18,&Hff0000,&Hff8080,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
Style: mine,華文新魏,18,&HFF0000,&HFF80FF0,&Hffffff,&Hffffff,0,0,1,2,1,2,20,20,20,0,134
有了具體經驗後,一般可以不作調整,需要改動的可以是「Fontname」,如改成黑體, 「Fontsize」,做字幕字型大小24比較合適。至於最後的「Encoding」,134表示簡體中文的編碼,繁體中文的編碼為136。
下面對各項作一說明,並列出屬性的取值及范圍
Name ---字體名稱---[Events]部分將引用該項,比如Default,Font1等
Fontname ---所使用的字型---比如黑體,楷體_GB2312等.對新載入的SSA文件,VOBSUB不會識別出宋體以外的字型,都按宋體輸出.但可以在DirectVobSub中重新定義
Fontsize ---字體大小---常用范圍8-72
PrimaryColour ---主體顏色---顏色格式為&HXXXXXX,十六進制,X取值為0-f
SecondaryColour ---次要顏色---格式同上,卡拉OK中使用,即變色前的顏,變色後顯示主體顏色
TertiaryColour ---邊框顏色---格式同上
BackColour ---陰影顏色---格式同上
下面是一些常用顏色的代碼,以便在文件中直接添加和編輯:
&Hffffff 白 &H8080ff 淺紅
&H000000 黑 &H80ffff 淺黃
&H0000ff 深紅 &HFF8000 亮藍
&H00ffff 深黃 &H80ff00 淺綠
&Hff0000 深藍 &H00ff00 亮綠
&H008000 深綠 &Hff00ff 紫紅(偏紫)
&H0080ff 橙 &H8000ff 紫紅(偏紅)
&Hff0080 紫 &Hffff00 淺藍
Bold ---粗體---0關閉,-1開啟
Italic ---斜體---0關閉,-1開啟
BorderStyle ---邊框樣式---取值1:正常,取值3:有一覆蓋區域
Outline ---邊框寬度---取值范圍1-4,數字越大邊框越寬
Shadow ---陰影距離---取值范圍0-4,數字越大陰影越厚
Alignment ---對齊方式---這是重中之重,學懂對齊方式等於學懂了一半的SSA,其用法將在下面的代碼部分作詳細的介紹,這里只作簡單的說明(下面各位置的數字就是Alignment的取值,很好記:從1-11,沒有4和8這兩個數,其餘都是連續排列):
左 中 右
上 5 6 7
中 9 10 11
下 1 2 3
MarginL ---字幕距左邊的距離---取值范圍0-PlayResX的數值
MarginR ---字幕距右邊的距離---取值范圍0-PlayResX的數值
MarginV ---字幕高度---取值范圍0-PlayResY的數值
AlphaLevel---字體透明度---透明度格式為&HXX,十六進制,X取值為0-f
Encoding ---編碼---簡體134,繁體138
3.[Events]
Format: Marked, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
從這里開始就是字幕部分了,以「Dialogue: Marked=0,0:00:01.34,0:00:02.05,Default,,0000,0000,0000,,」定義開頭。如果只是單純做字幕用,那麼這句後面就是字幕部分了,而字幕的格式根據[V4 Styles]里設置的來顯示。Default可以換用上面設置的mine,那麼顯示的格式是按照mine裡面設定!
這里是將[v4 Styles]部分中已定義的字體提供給字幕,並能對字體的各屬性重新定義;通過特定的SSA代碼實現特效.
Format: Marked, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Marked---標記---一般都設為0
Start ---字幕開始時間---格式0:00:00.00最小單位0.01秒
End ---字幕結束時間---格式同上
Style ---字體名稱---引用的是[v4 Styles]部分中的Name項
Name ---名字---注意這個Name和[v4 Styles]部分中的Name完全不同,相當於注釋,一般省略,省略後只留一逗號.
MarginL---是對[v4 Styles]部分MarginL值的重新設定,0000表示採用原值;若不為零,則代替原值(此時原值不再起作用)
MarginR---是對[v4 Styles]部分MarginR值的重新設定,用法同上
MarginV---是對[v4 Styles]部分MarginV值的重新設定,用法同上
Effect---這里是SSA為編輯人員方便使用動態效果而自定義的代碼,有Scroll up,Scroll down,Banner和Karaoke四種形式.為集中學習這里就不作介紹將其放到SSA代碼部分說明.
Text---字幕區---在這里可以添加代碼改變字體屬性,實現多種特效
其實[v4 Styles]部分就是一個存放各種字體以及該字體屬性初始值的一個場所,它的大小,顏色,字幕所在的位置等信息都放在這里;而[Events]部分則是把[v4 Styles]部分中的各個字體應用到文本中去,並且能夠對已定義的字體的各種屬性進行修改以達到需要的效果.打個比方,幾種不同類型的木材,具有各自的原始尺寸顏色,經過加工改變大小塗上新的顏色(或者直接使用原料),從而做成各種傢俱材料.[v4 Styles]部分就相當於放置這些原始木材的倉庫,而[Events]部分則是執行怎樣加工木材並將其安裝到傢俱上.
二.下面介紹SSA代碼的用法
SSA代碼
首先對下面代碼中用到的符號說明一下:
<..>---參數
[..]---可選項
<../..>---任選其中一項
規定:所有代碼之前加\
所有代碼放在括弧{}內,\N,\n,\h例外。
\N---換行---換行後兩行之間沒有空隙
\n---空格---或直接按空格鍵,超出范圍自動換行
\h---空格---或直接按空格鍵
\b<0/1>---粗體---0關閉,1開啟
\i<0/1>---斜體---0關閉,1開啟
\bord---邊框寬度---width取值范圍1-4,數字越大邊框越寬
\shad---陰影距離---depth取值范圍0-4,數字越大陰影越厚
B. 如何提取電影內嵌字幕
一般內嵌的字幕是提取不出來的。
但是也不是不能解決
用esrXP可以提取內嵌字幕
esrXP_Beta_10下載地址
http://www.namipan.com/d/esrXP_Beta_10.zip/
教程地址:http://blog.hangzhou.com.cn/index.php/424652/viewspace-170525.html
C. 如何將rmvb格式影片中的字幕提取出來並作成word或txt文件
1、首先從rmvb格式影片中將字幕以srt格式提取出來,打開aegisub軟體,將srt字幕拖入軟體。
D. 如何截取電影片段和配字幕
可以下載安裝狸窩視頻轉化器,我自己用過,剪視頻和配字幕都可以的,官網上好像有教程,希望能幫到您~
E. 如何提取DVD影片中的字幕
DVD影片中的字幕,通常有兩種:一種是外掛式,這種字幕有單獨的字幕文件,可以拷貝出來。
二是內嵌的字幕,也就是與視頻畫面一同編輯好的字幕。這類DVD片中的字幕,是無法提取出來的。 目前的DVD影片,通常是這種類型。
F. 怎樣把電影里的字幕給分離出來
rmvb格式的電影裡面,字幕是嵌入到視頻當中的,無法提取;mkv電影文件,特別是高清版本,字幕是軟封裝進去的,可以用 mkvtoolnix + mkvextractgui2 來提取,附件就是這套軟體。
提取到的字幕,一般是 srt 格式,這個可以用「LRC歌詞轉換工具」把它轉換成 txt 文本格式。如果是圖形字幕,例如 idx+sub 或者藍光sup格式,就需要先通過字元識別(OCR),把字幕識別成 srt 文本格式,然後再轉換成 txt 格式。
G. 如何從電影中 提取 片段
有個最好的辦法.用屏幕錄象專家.你要那一段就錄那一段.錄完之後在用格式工廠轉換一下格式就可以了.而且呀什麼格式就轉什麼格式.就連網上不能下載的也可以用此方法
望採納