web-dev-qa-db-ja.com

不正なURIを修正する方法はURIではありません

Rubyバージョン_1.9.3_を使用しています。以下の動画URLからホスト名を取得したいのですが、

コードで試した

_require 'uri'
url = "https://ferrari-view.4me.it/view-share/playerp/?plContext=http://ferrari-%201363948628-stream.4mecloud.it/live/ferrari/ngrp:livegenita/manifest.f4m&cartellaConfig=http://ferrari-4me.weebo.it/static/player/config/&cartellaLingua=http://ferrari-4me.weebo.it/static/player/config/&poster=http://pusher.newvision.it:8080/resources/img1.jpg&urlSkin=http://ferrari-4me.weebo.it/static/player/swf/skin.swf?a=1363014732171&method=GET&target_url=http://ferrari-4me.weebo.it/static/player/swf/player.swf&userLanguage=IT&styleTextColor=#000000&autoPlay=true&bufferTime=2&isLive=true&highlightColor=#eb2323&gaTrackerList=UA-23603234-4"  
puts URI.parse(url).Host  
_

例外URI :: InvalidURIError:bad URI(is not URI?)をスローします:

私はURLをエンコードしてから以下のように解析しようとしました

_puts URI.parse(URI.parse(url)).Host
_

同じURI::InvalidURIError: bad URI(is not URI?)例外をスローします

ただし、上記のコードは以下のURLで機能します。

url = http://www.youtube.com/v/GpQDa3PUAbU?version=3&autohide=1&autoplay=1

これを修正する方法は?ご提案をお願いします。ありがとう

51
prabu

このURLは有効ではありませんが、ブラウザ自体は:、/などの特殊文字について厳密ではないため、ブラウザで機能します。

最初にURIをエンコードする必要があります

encoded_url = URI.encode(url)

そして、それを解析します

URI.parse(encoded_url)
109

Addressable :: URIは、URIのより優れた、rfc準拠の代替です。

require "addressable/uri"
Addressable::URI.parse(url).Host
#=> "ferrari-view.4me.it"

gem install addressable 最初。

17
pguardiario

これを試して:

safeurl = URI.encode(url.strip)
response = RestClient.get(safeurl)
2
angela
uri = URI.parse(URI.encode(url.strip))
0
rusllonrails

URI.parseは正しい:そのURIは違法です。誤ってブラウザで動作するからといって、それが合法になるわけではありません。 ではない URIであるため、そのURIを解析することはできません。

0
Jörg W Mittag

URIクエリが無効です。 数文字 があり、URI::encode()でエンコードする必要があります。例えば、 #、 、 または &はクエリでは無効です。

コードの作業バージョンの下

    require 'uri'

    plContext = URI::encode("http://ferrari-%201363948628-stream.4mecloud.it/live/ferrari/ngrp:livegenita/manifest.f4m")
    cartellaConfig = URI::encode("http://ferrari-4me.weebo.it/static/player/config/")
    cartellaLingua = URI::encode("http://ferrari-4me.weebo.it/static/player/config/")
    poster = URI::encode("http://pusher.newvision.it:8080/resources/img1.jpg")
    urlSkin = URI::encode("http://ferrari-4me.weebo.it/static/player/swf/skin.swf?a=1363014732171")
    target_url = URI::encode("http://ferrari-4me.weebo.it/static/player/swf/player.swf")
    url = "https://ferrari-view.4me.it/view-share/playerp/?"
    url << "plContext=#{plContext}"
    url << "&cartellaConfig=#{cartellaConfig}"
    url << "&cartellaLingua=#{cartellaLingua}"
    url << "&poster=#{poster}"
    url << "&urlSkin=#{urlSkin}"
    url << "&method=GET"
    url << "&target_url=#{target_url}"
    url << "&userLanguage=IT"
    url << "&styleTextColor=#{URI::encode("#000000")}"
    url << "&autoPlay=true&bufferTime=2&isLive=true&gaTrackerList=UA-23603234-4"
    url << "&highlightColor=#{URI::encode("#eb2323")}"  
    puts url
    puts URI.parse(url).Host
0
toch