灏天阁

JavaScript中更安全的URL读写

· Yin灏

前言

URL对于我们开发人员来讲,应该是非常熟悉了。在对URL进行参数拼接时,我们一般都会直接进行字符串拼接或使用模版字符串,因为这样非常方便,但是我们这样其实会在不知不觉中以不安全的方式编写 URL。

比如,我们通常会这样写:

const url = `https://www.baidu.com?model=${model}&locale=${locale}?query.text=${text}`;

这样确实写起来非常方便,但你可能会在不知不觉中会你的程序带来一些问题。(如上代码就是一段有问题的代码)

常见问题

不正确的分隔符

1fg.png

这种错误可能在新手身上比较常见,但即使是经验老道的程序员也不可能绝对避免这个错误。造成这个错误的罪魁祸首绝大多数是在修改或移动代码之后。例如,你有一个结构正确的 URL,然后将一个片段从一个片段复制到另一个片段,然后错过了参数分隔符的错误排序。

忘记编码

2bm.png

许多时候我们URL上的参数是需要进行编码的,因为URL参数可以是任意类型的文本,包括空格和特殊字符,这会给我们带来一些无法预料的问题。

所以为了避免这种情况,我们往往会这样写:

const url = `https://www.baidu.com
  ?model=${encodeURIComponent(model)}&locale=${encodeURIComponent(
  locale
)}&query.text=${encodeURIComponent(text)}`;

但这样的写法给人的感觉是非常的冗余且不雅观 😓

意外的空白字符

3kb.png

有时候我们为了将一个长 URL 分成多行,我们会不小心在 URL 中包含了换行符和额外的空格,这将导致无法按预期进行抓取。

所以为了正确分解URL字符串,我们通常会这样写:

const url =
  `https://www.baidu.com` +
  `?model=${encodeURIComponent(model)}&locale=${encodeURIComponent(
    locale
  )}&query.text=${encodeURIComponent(text)}`;

但这样是我们的代码变得更加混乱以及难以阅读。

难道就没有一种既安全又优雅的方法来编写URL吗?🤔

URL 构造函数

既优雅又安全的方法就是使用URL构造函数

URL() 构造函数返回一个新创建的 URL对象,表示由一组参数定义的 URL。

如果给定的基本 URL 或生成的 URL 不是有效的 URL 链接,则会抛出一个TypeError

语法

const url = new URL(url [, base])

参数

  • url 是一个表示绝对或相对 URL 的 DOMString。如果url 是相对 URL,则会将 base 用作基准 URL。如果 url 是绝对 URL,则无论参数base是否存在,都将被忽略
  • base 可选 是一个表示基准 URL 的 DOMString,在 url 是相对 URL 时,它才会起效。如果未指定,则默认为 ''

解决

所以上面的URL我们就可以这样来写:

const url = new URL("https://www.baidu.com");

url.searchParams.set("model", model);
url.searchParams.set("locale", locale);
url.searchParams.set("text", text);

这样写就可以为我们解决这些问题:

  • 分隔符总是正确的(?对于第一个参数,以及之后的参数)
  • 所有参数都自动编码
  • 长 URL 跨多行时没有额外空白字符的风险

修改 URL

对于我们在不知道当前参数状态下的情况,它也非常适用。

比如:

url += (url.includes("?") ? "&" : "?") + "foo=bar";

使用URL构造函数我们可以这样写:

// url是一个URL构造函数
url.searchParams.set("foo", "bar");
// 或者是一个字符串
const structuredUrl = new URL(url);
structuredUrl.searchParams.set("foo", "bar");
url = structuredUrl.toString();

读取 URL

现在,我如果想在没有库的情况下从当前 URL 读取查询参数这个由来已久的问题也得到了解决。

const pageParam = new URL(location.href).searchParams.get("page");
const url = new URL(location.href);
const currentPage = Number(url.searchParams.get("page"));
url.searchParams.set("page", String(currentPage + 1));
location.href = url.toString();

这不仅限于浏览器,它也可以在 Node.js 中使用

const http = require("http");
const server = http.createServer((req, res) => {
  const url = new URL(req.url, `https://${req.headers.host}`);
});

URL 属性

URL 实例支持您已经在浏览器中使用的所有属性,例如 onwindow.location或 anchor 元素,所有这些我们都可以读写

const url = new URL("https://www.baidu.com/a?page=1");
url.protocol; // https:
url.host; // www.baidu.com
url.pathname; // /a
url.search; // ?page=1
url.href; // https://www.baidu.com/a?page=1
url.origin; // https://www.baidu.com
url.searchParams.get("page"); // 1

4url.png

常用 URLSearchParams 方法

URLSearchParams对象可在URL实例上访问,url.searchParams支持许多方便的方法:

searchParams.has(name)

检查搜索参数是否包含给定名称

url.searchParams.has("page"); // true

searchParams.get(name)

获取给定参数的值

url.searchParams.get("page"); // '1'

searchParams.getAll(name)

获取为参数提供的所有值。如果你允许同名的多个值,这很方便,例如&page=1&page=2

url.searchParams.getAll("page"); // ['1']

searchParams.set(name, value)

设置参数的值

url.searchParams.set("page", "1");

searchParams.append(name, value)

附加一个参数——如果你可能多次支持同一个参数,这很有用,比如&page=1&page=2

url.searchParams.append("page", "2");

searchParams.delete(name)

从 URL 中完全删除一个参数

url.searchParams.delete("page");

兼容性

new URL基本支持所有现代浏览器(除了 IE),以及 Node.js。

5urljr.png

- Book Lists -