文字列から二重引用符の\ "記号を削除します

Question

ベクトルから\"を削除する必要があります。これは私のデータです：

data <- c("\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1803224&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Flinux-linux-security-masterclass-3-in-1%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1848638&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Fmastering-kali-linux%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1426684&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Finformation-gathering-with-kali-linux%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1628300&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Flinux-switchblade%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1615700&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Fadministrador-de-sistemas-junior-en-windows-server-y-linux%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.809770&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Flearn-bash-Shell-in-linux-for-beginners-lite%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.574388&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Fhow-to-install-linux-ubuntu-server%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1436610&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Fcentos-and-ubuntu-managing-packages%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1771266&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Flinux-foundation-certified-system-administrator-exam%2F", "\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1734052&type=2&murl=https%3A%2F%2Fwww.udemy.com%2Flinux-server-security%2F" )

ご覧のとおり、すべてのオブジェクトは\"で始まります。これらの文字を具体的に削除してリンクを残すにはどうすればよいですか？

milan · Accepted Answer

あなたはこれを試すことができます。実際に必要なのは、\"ではなく"\を削除することです（質問の未編集バージョンで提案されているように）。最初の"は、キャラクターの各要素を表す必要があります。

gsub('[\"]', '', data)

akrun · Answer

または、パターンに'"'を使用することもできます

gsub('"', "", data)

zx8754 · Answer

常に最初の文字である場合は、部分文字列を使用します。

substring(data, 2)

これは、どのregexソリューションよりも高速である必要があります。

data <- rep(data, 1000) microbenchmark::microbenchmark( a = substring(data, 2), b = gsub("\"", "", data, fixed = TRUE), c = gsub('"', "", data), d = gsub('[\"]', '', data), e = stringr::str_replace(data, '[\"]', ''), f = gsub("^.","",data) ) # Unit: milliseconds # expr min lq mean median uq max neval # a 2.835013 2.849838 2.933796 2.857393 2.900301 4.446956 100 # b 4.728632 4.739751 4.788882 4.754861 4.795203 5.200185 100 # c 7.388025 7.413684 7.503427 7.458444 7.555520 8.160925 100 # d 7.390876 7.412686 7.530044 7.454453 7.533568 8.535544 100 # e 12.019154 12.205608 12.430870 12.316084 12.581081 13.917336 100 # f 15.712882 15.735975 15.875353 15.770043 15.861275 18.906262 100

Lennyy · Answer

これも同様に機能します。

gsub("\"", "", data)

neilfws · Answer

使用する fixed = TRUEパターンを文字列として一致させる：

gsub("\"", "", data, fixed = TRUE)

allanvc · Answer

@milanの方が速かった:)

stringrを使用したアプローチは次のようになります

library(stringr) str_replace(data, '[\"]', '')

P1storius · Answer

バックスラッシュの頭痛をスキップして、最初の文字を削除することもできます。

gsub("^.","",data)